周鸿祎谈Sora模型：中美AI差距可能还在加大

站长网2024-02-17 10:18:270阅

2月17日消息，近日，OpenAI 发布了 Sora 模型，该模型可根据用户输入的文本提示词描述，生成一段60秒钟的视频内容。从OpenAI公开的演示视频来看效果非常超现实。

昨日，360董事长周鸿祎在微博发文，谈到OpenAI的文字转视频模型Sora。他认为:Sora意味着 AGI实现将从10年缩短到1年。

周鸿祎表示，AI不一定那么快颠覆所有行业，但它能激发更多人的创作力。今天 Sora 可能给广告业、电影预告片、短视频行业带来巨大的颠覆，但它不一定那么快击败 TikTok，更可能成为 TikTok的创作工具。

同时，周鸿祎还谈到中美AI差距，他认为:OpenAl手里应该还藏着一些秘密武器，无论是 GPT-5，还是机器自我学习自动产生内容，包括 AIGC。他们手里的武器并没有全拿出来。这样看来中国跟美国的 AI 差距可能还在加大。

以下为周鸿祎发文全文:

Sora意味着 AGI实现将从10年缩短到1年

年前我在风马牛演讲上分享了大模型十大趋势预测，没想到年还没过完，就验证了好几个从 Gemini、英伟达的 Chat With RTX到 OpenA!发布 Sora，大家都觉得很炸裂。朋友问我怎么看 Sora，我谈几个观点，总体来说就是我认为AGI很快会实现，就这几年的事儿了:

第一，科技竞争最终比拼的是让人才密度和深厚积累。很多人说 Sora的效果吊打 Pika和Runway。这很正常，和创业者团队比OpenAl 这种有核心技术的公司实力还是非常强劲的。有人认为有了 AI以后创业公司只需要做个体户就行，实际今天再次证明这种想法是非常可笑的。

第二，AI不一定那么快颠覆所有行业，但它能激发更多人的创作力。今天很多人谈到 Sora 对影视工业的打击，我倒不觉得是这样，因为机器能生产一个好视频，但视频的主题、脚本和分镜头策划、台词的配合，都需要人的创意至少需要人给提示词。一个视频或者电影是由无数个60秒组成的。今天 Sora 可能给广告业、电影预告片、短视频行业带来巨大的颠覆，但它不一定那么快击败 TikTok，更可能成为 TikTok的创作工具。

第三，我一直说国内大模型发展水平表面看已经接近 GPT-3.5了，但实际上跟4.0比还有一年半的差距。而且我相信 OpenAl手里应该还藏着一些秘密武器，无论是 GPT-5，还是机器自我学习自动产生内容，包括 AIGC。奥特曼是个营销大师，知道怎样掌握节奏，他们手里的武器并没有全拿出来。这样看来中国跟美国的 AI 差距可能还在加大。

第四，大语言模型最牛的是，它不是填空机，而是能完整地理解这个世界的知识。这次很多人从技术上、从产品体验上分析Sora，强调它能输出60秒视频，保持多镜头的一致性，模拟自然世界和物理规律，实际这些都比较表象，最重要的是 Sora 的技术思路完全不一样。因为这之前我们做视频做图用的都是 Diffusion，你可以把视频看成是多个真实图片的组合，它并没有真正掌握这个世界的知识。现在所有的文生图、文生视频都是在2D 平面上对图形元素进行操作，并没有适用物理定律。但 Sora 产生的视频里，它能像人一样理解坦克是有巨大冲击力的，坦克能撞毁汽车，而不会出现汽车撞毁坦克这样的情况。所以我理解这次 OpenAl 利用它的大语言模型优势，把LLM 和 Diffusion 结合起来训练，让 Sora 实现了对现实世界的理解和对世界的模拟两层能力，这样产生的视频才是真实的，才能跳出2D 的范围模拟真实的物理世界。这都是大模型的功劳。这也代表未来的方向。有强劲的大模型做底子，基于对人类语言的理解，对人类知识和世界模型的了解，再叠加很多其他的技术，就可以创造各个领域的超级工具，比如生物医学蛋白质和基因研究，包括物理、化学、数学的学科研究上，大模型都会发挥作用。这次 Sora对物理世界的模拟，至少将会对机器人具身智能和自动驾驶带来巨大的影响。原来的自动驾驶技术过度强调感知层面，而没有工作在认知层面。其实人在驾驶汽车的时候，很多判断是基于对这个世界的理解。比如对方的速度怎么样，能否发生碰撞，碰撞严重性如何，如果没有对世界的理解就很难做出一个真正的无人驾驶。

所以这次 Sora 只是小试牛刀，它展现的不仅仅是一个视频制作的能力，它展现的是大模型对真实世界有了理解和模拟之后，会带来新的成果和突破。

第五，Open Al训练这个模型应该会阅读大量视频。大模型加上 Diffusion 技术需要对这个世界进行进一步了解，学习样本就会以视频和摄像头捕捉到的画面为主。一旦人工智能接上摄像头，把所有的电影都看一遍，把YouTube 上和 TikTok 的视频都看一遍，对世界的理解将远远超过文字学习，一幅图胜过千言万语，而视频传递的信息量又远远超过一幅图，这就离AGI真的就不远了，不是10年20年的问题，可能一两年很快就可以实现。

周鸿祎谈Sora模型中美AI差距可能还在加大

0000

评论列表

共(0)条

相关推荐

站长资讯
小鹏MONA旗下M03全球首秀将于 8 月正式上市
站长之家（ChinaZ.com）7月3日消息:今日，小鹏汽车携手出行巨头滴滴，正式发布——小鹏MONAM03。这款专为追求品质与激情的年轻族群量身定制的轿跑，不仅预示着小鹏汽车产品线的又一次飞跃，也标志着新能源汽车市场将迎来一股强劲的新势力。
站长网2024-07-03 15:35:43
0000
站长资讯
私域外呼引流这条路“死”了吗？
缘起是一位朋友在见实的交流群里分享了一张拼多多发给商家的《诱导第三方违规通知》。据他讲述，他的朋友A的店铺是从事家装行业的。某天有一用户因为无法安装桌子，又看不懂店铺客服提供的安装指导视频，于是乎，朋友A发起了虚拟号外呼。解决完问题挂断电话的瞬间，平台的违规通知便接踵而至。朋友A想发起申诉，但是官方客服直接提供了通话录音，且起诉排队24万名，直接斩断了他想要反驳的想法。
站长网2024-08-01 16:07:22
0000
年赚千万，谁在为AI输入法掏钱？
“追女生必备技巧:会聊天很重要，提升聊天段位，一键高情商回复，帮你沟通更出色。”正如这句广告语所说，在即将到来的这个过年相亲季里，总算有赛博军师可以在聊天冷场时为顾全彼此颜面兜底了。事实上，这些“电子嘴替”去年上线后的几个月里，就已经创下了过千万的营收记录，甚至还有平均高达数百万的日活用户为之背书，这也导致该类产品一度被外界视作AI应用商业化的一大范本。
站长网站长资讯2025-01-24 15:12:11
0000
站长资讯
动视暴雪或将“狮子开口”！微软难以准时完成收购
快科技7月16日消息，近日，随着微软与FTC诉讼的结束，影响微软收购动视暴雪的，似乎就仅仅剩下了英国CMA的阻拦。但随着CMA宣布将最终报告的截止日期从7月18日延长到8月29日，以获得更多时间来考虑微软详细和复杂的申请”，在协议规定的7月18日前完成收购已经几乎是不可能完成的事情。对此，有消息指出，微软或将重新与动视暴雪签订协议，从而延长收购的截止日期。
站长网2023-07-16 18:48:53
0000
小米15屏幕参数公布：M9发光材料 1.38mm超窄四等边直屏
今日，小米15系列手机的屏幕参数正式公布，该机型配备了一块被称为“超级阳光屏”的显示屏，其特点是拥有令人惊艳的1.38mm超窄四等边设计。这款屏幕采用了独家定制的M9发光材料和双微腔屏幕结构，使得发光效率在同类产品中领先，同时实现了屏幕功耗下降10%。此外，该屏幕还支持全亮度DC调光和全屏AOD（AlwaysOnDisplay）锁屏功能，为用户提供了更舒适的视觉体验。
站长网站长资讯2024-10-25 15:10:10
0000