Sora普通人理解的原理——帧处理_sora每生成一帧需要消耗-程序员宅基地

技术标签: llama  算法  深度学习  人工智能  目标跟踪  

前言

李一舟大家最近都看到过他的视频,或者是听说过他的事情,也都知道Sora还在测试中,但是它发的效果视频还是非常震撼的,并且整个视频时长是60s的,大家也都知道,抖音的中视频计划最低的时间要求就是大于60s的视频,那么,如果利用Sora来生成视频,那么真就可以批量处理了,可以离开剪辑师,一个人用Sora就可生成无数的视频,并且质量都不低,按照这个方法,那真的是一本万利啊。

大家都知道,现阶段文生图的功能基本上已经完全实现了,而且使用的价值也不高,如果自己有一台配置比较高的电脑,自己搭建一个stable diffusion就能生成各类的图片,而且高清处理一下,图片的画质也是相当的可以。那么Sora是依赖于什么生成的呢?

视频原理

我们玩过stablediffusion的都知道一个插件【AnimateDiff】,这个插件就可以生成视频,一般生成2~15s的视频,不会太大,因为对应的资源消耗太大,很多电脑都跑不起来,后来清华除了一款插件可以让内存消耗小一些,可以消耗的时间又是太多,用时间换空间,要不就是用空间换时间,但是对应的原理我们能知道。

如果生成的内容较大,计算机扛不住就会看到以下的提示。

很明显,超了,玩不转了。但是为什么会玩不转呢?其实就是生成的内容比较多,一次性进入到内存里,所以玩不转,如果要是单个图片的生成就是没有问题的呢。

一般电影的帧数为24帧,我们所看的视频16~24帧,连续播放出来即可看到视频,当然,也会有一些超高清的甚至达到60帧,这个帧数代表每秒钟显示的图片数量,数量越多,对应的画质也是越好。

生成一张图片的成本

就拿李一舟网站来说,他那是一般生成一张图需要1万算力起步,提问需要上千算力起步,如果不够了再去购买,好家伙。最贵的钻石会员399元,那是真的贵啊!冲百度的千帆大模型能用好久呢。

你看看,这贵的,受不了,就算我们搭个桥去外网用GPT4也就这么多吧。

我们在从百度上看看价格,这价格也才两分钱一秒啊,一般一张图片也就1毛钱多一些吧。

我们来简单计算一下,1毛钱一张图片,但是非高清的图片哦,如果高清就得翻翻,那么也就是2毛一张,在上上不能每次都能精准的描述图片,损失率我们估计在30%,故而大致需要:

0.22460*1.3=374.4元

算下来可以看到竟然高达374.4元/1min视频,这成本依然是很高的呢。但是我们知道,具体的算法肯定是被优化了的,如果成本这么高的话肯定是无法商业化处理的,对应的我们就可以期待一下了,程序员的一小步,人类的一大步。

在这里我们可以预计一下成本,既然能让大家都用得起,那么应该1$完成1个60s的视频,也就是差不多六块钱,这样的话还是可以控制成本的。

Sora预计发展趋势

我也算在此行深耕了好多年,我来大胆的分析判断一下,Sora发展的方向:

1、降低成本(压力在算法工程师)
2、融合物理计算(例如C4D等工具)
3、融合化学反应原理(真正的去做实验)
4、融合生物学(生命科学药物或科技)

为什么我没有说其它商用呢,因为我们当前的这个世界本质是由少部分超级资本家所掌握的,资本家要长期享受这种高人一等的生活就必须去大力研发生命科学,他们的资本投入完全可能大于某些国家的年生产总值,故而超级科学家们服务的对象肯定是他们,所以说,Sora会给我们普通人一些娱乐方向的产品,但是2~4都是为了更好的服务于资本而发展。

Sora在短视频上的新风口——对于年长人友好

Sora对于越有阅历的人越友好,大家生成的视频也得在一定的语言描述中才能生成,这会大大的提高老年人再就业的机会,让老人们再次贡献他/她们的价值。

最后,祝大家都能赶上这波Sora的风口,让自己的生活更加没满。

大模型岗位需求

大模型时代,企业对人才的需求变了,AIGC相关岗位人才难求,薪资持续走高,AI运营薪资平均值约18457元,AI工程师薪资平均值约37336元,大模型算法薪资平均值约39607元。
在这里插入图片描述

掌握大模型技术你还能拥有更多可能性

• 成为一名全栈大模型工程师,包括Prompt,LangChain,LoRA等技术开发、运营、产品等方向全栈工程;

• 能够拥有模型二次训练和微调能力,带领大家完成智能对话、文生图等热门应用;

• 薪资上浮10%-20%,覆盖更多高薪岗位,这是一个高需求、高待遇的热门方向和领域;

• 更优质的项目可以为未来创新创业提供基石。

整理了我入门大模型的学习路线和自用资料,在全民LLM时期,多输入一些就多一重安全感。

有需要的小伙伴,可以保存图片到wx扫描二v码免费领取【保证100%免费


在这里插入图片描述

人工智能书籍

第一阶段:零基础入门(3-6个月)

新手应首先通过少而精的学习,看到全景图,建立大局观。 通过完成小实验,建立信心,才能避免“从入门到放弃”的尴尬。因此,第一阶段只推荐4本最必要的书(而且这些书到了第二、三阶段也能继续用),入门以后,在后续学习中再“哪里不会补哪里”即可。

第二阶段:基础进阶(3-6个月)

熟读《机器学习算法的数学解析与Python实现》并动手实践后,你已经对机器学习有了基本的了解,不再是小白了。这时可以开始触类旁通,学习热门技术,加强实践水平。在深入学习的同时,也可以探索自己感兴趣的方向,为求职面试打好基础。

第三阶段:工作应用

这一阶段你已经不再需要引导,只需要一些推荐书目。如果你从入门时就确认了未来的工作方向,可以在第二阶段就提前阅读相关入门书籍(对应“商业落地五大方向”中的前两本),然后再“哪里不会补哪里”。

在这里插入图片描述
有需要的小伙伴,可以点击下方链接免费领取或者V扫描下方二维码免费领取

版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。
本文链接:https://blog.csdn.net/AAI666666/article/details/136444674

智能推荐

c# 调用c++ lib静态库_c#调用lib-程序员宅基地

文章浏览阅读2w次,点赞7次,收藏51次。四个步骤1.创建C++ Win32项目动态库dll 2.在Win32项目动态库中添加 外部依赖项 lib头文件和lib库3.导出C接口4.c#调用c++动态库开始你的表演...①创建一个空白的解决方案,在解决方案中添加 Visual C++ , Win32 项目空白解决方案的创建:添加Visual C++ , Win32 项目这......_c#调用lib

deepin/ubuntu安装苹方字体-程序员宅基地

文章浏览阅读4.6k次。苹方字体是苹果系统上的黑体,挺好看的。注重颜值的网站都会使用,例如知乎:font-family: -apple-system, BlinkMacSystemFont, Helvetica Neue, PingFang SC, Microsoft YaHei, Source Han Sans SC, Noto Sans CJK SC, W..._ubuntu pingfang

html表单常见操作汇总_html表单的处理程序有那些-程序员宅基地

文章浏览阅读159次。表单表单概述表单标签表单域按钮控件demo表单标签表单标签基本语法结构<form action="处理数据程序的url地址“ method=”get|post“ name="表单名称”></form><!--action,当提交表单时,向何处发送表单中的数据,地址可以是相对地址也可以是绝对地址--><!--method将表单中的数据传送给服务器处理,get方式直接显示在url地址中,数据可以被缓存,且长度有限制;而post方式数据隐藏传输,_html表单的处理程序有那些

PHP设置谷歌验证器(Google Authenticator)实现操作二步验证_php otp 验证器-程序员宅基地

文章浏览阅读1.2k次。使用说明:开启Google的登陆二步验证(即Google Authenticator服务)后用户登陆时需要输入额外由手机客户端生成的一次性密码。实现Google Authenticator功能需要服务器端和客户端的支持。服务器端负责密钥的生成、验证一次性密码是否正确。客户端记录密钥后生成一次性密码。下载谷歌验证类库文件放到项目合适位置(我这边放在项目Vender下面)https://github.com/PHPGangsta/GoogleAuthenticatorPHP代码示例://引入谷_php otp 验证器

【Python】matplotlib.plot画图横坐标混乱及间隔处理_matplotlib更改横轴间距-程序员宅基地

文章浏览阅读4.3k次,点赞5次,收藏11次。matplotlib.plot画图横坐标混乱及间隔处理_matplotlib更改横轴间距

docker — 容器存储_docker 保存容器-程序员宅基地

文章浏览阅读2.2k次。①Storage driver 处理各镜像层及容器层的处理细节,实现了多层数据的堆叠,为用户 提供了多层数据合并后的统一视图②所有 Storage driver 都使用可堆叠图像层和写时复制(CoW)策略③docker info 命令可查看当系统上的 storage driver主要用于测试目的,不建议用于生成环境。_docker 保存容器

随便推点

网络拓扑结构_网络拓扑csdn-程序员宅基地

文章浏览阅读834次,点赞27次,收藏13次。网络拓扑结构是指计算机网络中各组件(如计算机、服务器、打印机、路由器、交换机等设备)及其连接线路在物理布局或逻辑构型上的排列形式。这种布局不仅描述了设备间的实际物理连接方式,也决定了数据在网络中流动的路径和方式。不同的网络拓扑结构影响着网络的性能、可靠性、可扩展性及管理维护的难易程度。_网络拓扑csdn

JS重写Date函数,兼容IOS系统_date.prototype 将所有 ios-程序员宅基地

文章浏览阅读1.8k次,点赞5次,收藏8次。IOS系统Date的坑要创建一个指定时间的new Date对象时,通常的做法是:new Date("2020-09-21 11:11:00")这行代码在 PC 端和安卓端都是正常的,而在 iOS 端则会提示 Invalid Date 无效日期。在IOS年月日中间的横岗许换成斜杠,也就是new Date("2020/09/21 11:11:00")通常为了兼容IOS的这个坑,需要做一些额外的特殊处理,笔者在开发的时候经常会忘了兼容IOS系统。所以就想试着重写Date函数,一劳永逸,避免每次ne_date.prototype 将所有 ios

如何将EXCEL表导入plsql数据库中-程序员宅基地

文章浏览阅读5.3k次。方法一:用PLSQL Developer工具。 1 在PLSQL Developer的sql window里输入select * from test for update; 2 按F8执行 3 打开锁, 再按一下加号. 鼠标点到第一列的列头,使全列成选中状态,然后粘贴,最后commit提交即可。(前提..._excel导入pl/sql

Git常用命令速查手册-程序员宅基地

文章浏览阅读83次。Git常用命令速查手册1、初始化仓库git init2、将文件添加到仓库git add 文件名 # 将工作区的某个文件添加到暂存区 git add -u # 添加所有被tracked文件中被修改或删除的文件信息到暂存区,不处理untracked的文件git add -A # 添加所有被tracked文件中被修改或删除的文件信息到暂存区,包括untracked的文件...

分享119个ASP.NET源码总有一个是你想要的_千博二手车源码v2023 build 1120-程序员宅基地

文章浏览阅读202次。分享119个ASP.NET源码总有一个是你想要的_千博二手车源码v2023 build 1120

【C++缺省函数】 空类默认产生的6个类成员函数_空类默认产生哪些类成员函数-程序员宅基地

文章浏览阅读1.8k次。版权声明:转载请注明出处 http://blog.csdn.net/irean_lau。目录(?)[+]1、缺省构造函数。2、缺省拷贝构造函数。3、 缺省析构函数。4、缺省赋值运算符。5、缺省取址运算符。6、 缺省取址运算符 const。[cpp] view plain copy_空类默认产生哪些类成员函数

推荐文章

热门文章

相关标签