周鸿祎谈Sora模型:中美AI差距可能还在加大
2月17日消息,近日,OpenAI 发布了 Sora 模型,该模型可根据用户输入的文本提示词描述,生成一段60秒钟的视频内容。从OpenAI公开的演示视频来看效果非常超现实。
昨日,360董事长周鸿祎在微博发文,谈到OpenAI的文字转视频模型Sora。他认为:Sora意味着 AGI实现将从10年缩短到1年。
周鸿祎表示,AI不一定那么快颠覆所有行业,但它能激发更多人的创作力。今天 Sora 可能给广告业、电影预告片、短视频行业带来巨大的颠覆,但它不一定那么快击败 TikTok,更可能成为 TikTok的创作工具。
同时,周鸿祎还谈到中美AI差距,他认为:OpenAl手里应该还藏着一些秘密武器,无论是 GPT-5,还是机器自我学习自动产生内容,包括 AIGC。他们手里的武器并没有全拿出来。这样看来中国跟美国的 AI 差距可能还在加大。
以下为周鸿祎发文全文:
Sora意味着 AGI实现将从10年缩短到1年
年前我在风马牛演讲上分享了大模型十大趋势预测,没想到年还没过完,就验证了好几个从 Gemini、英伟达的 Chat With RTX到 OpenA!发布 Sora,大家都觉得很炸裂。朋友问我怎么看 Sora,我谈几个观点,总体来说就是我认为AGI很快会实现,就这几年的事儿了:
第一,科技竞争最终比拼的是让人才密度和深厚积累。很多人说 Sora的效果吊打 Pika和Runway。这很正常,和创业者团队比OpenAl 这种有核心技术的公司实力还是非常强劲的。有人认为有了 AI以后创业公司只需要做个体户就行,实际今天再次证明这种想法是非常可笑的。
第二,AI不一定那么快颠覆所有行业,但它能激发更多人的创作力。今天很多人谈到 Sora 对影视工业的打击,我倒不觉得是这样,因为机器能生产一个好视频,但视频的主题、脚本和分镜头策划、台词的配合,都需要人的创意至少需要人给提示词。一个视频或者电影是由无数个60秒组成的。今天 Sora 可能给广告业、电影预告片、短视频行业带来巨大的颠覆,但它不一定那么快击败 TikTok,更可能成为 TikTok的创作工具。
第三,我一直说国内大模型发展水平表面看已经接近 GPT-3.5了,但实际上跟4.0比还有一年半的差距。而且我相信 OpenAl手里应该还藏着一些秘密武器,无论是 GPT-5,还是机器自我学习自动产生内容,包括 AIGC。奥特曼是个营销大师,知道怎样掌握节奏,他们手里的武器并没有全拿出来。这样看来中国跟美国的 AI 差距可能还在加大。
第四,大语言模型最牛的是,它不是填空机,而是能完整地理解这个世界的知识。这次很多人从技术上、从产品体验上分析Sora,强调它能输出60秒视频,保持多镜头的一致性,模拟自然世界和物理规律,实际这些都比较表象,最重要的是 Sora 的技术思路完全不一样。因为这之前我们做视频做图用的都是 Diffusion,你可以把视频看成是多个真实图片的组合,它并没有真正掌握这个世界的知识。现在所有的文生图、文生视频都是在2D 平面上对图形元素进行操作,并没有适用物理定律。但 Sora 产生的视频里,它能像人一样理解坦克是有巨大冲击力的,坦克能撞毁汽车,而不会出现汽车撞毁坦克这样的情况。所以我理解这次 OpenAl 利用它的大语言模型优势,把LLM 和 Diffusion 结合起来训练,让 Sora 实现了对现实世界的理解和对世界的模拟两层能力,这样产生的视频才是真实的,才能跳出2D 的范围模拟真实的物理世界。这都是大模型的功劳。这也代表未来的方向。有强劲的大模型做底子,基于对人类语言的理解,对人类知识和世界模型的了解,再叠加很多其他的技术,就可以创造各个领域的超级工具,比如生物医学蛋白质和基因研究,包括物理、化学、数学的学科研究上,大模型都会发挥作用。这次 Sora对物理世界的模拟,至少将会对机器人具身智能和自动驾驶带来巨大的影响。原来的自动驾驶技术过度强调感知层面,而没有工作在认知层面。其实人在驾驶汽车的时候,很多判断是基于对这个世界的理解。比如对方的速度怎么样,能否发生碰撞,碰撞严重性如何,如果没有对世界的理解就很难做出一个真正的无人驾驶。
所以这次 Sora 只是小试牛刀,它展现的不仅仅是一个视频制作的能力,它展现的是大模型对真实世界有了理解和模拟之后,会带来新的成果和突破。
第五,Open Al训练这个模型应该会阅读大量视频。大模型加上 Diffusion 技术需要对这个世界进行进一步了解,学习样本就会以视频和摄像头捕捉到的画面为主。一旦人工智能接上摄像头,把所有的电影都看一遍,把YouTube 上和 TikTok 的视频都看一遍,对世界的理解将远远超过文字学习,一幅图胜过千言万语,而视频传递的信息量又远远超过一幅图,这就离AGI真的就不远了,不是10年20年的问题,可能一两年很快就可以实现。
科大讯飞宣布星火内测APP上线 仅安卓可下载
就在刚刚,科大讯飞宣布,星火内测APP上线,超200个智能助手全面提升工作效率解锁创意工具,更可快捷创建个性助手。据了解,科大讯飞将在今日发布讯飞星火认知大模型V1.5。根据此前透露,讯飞星火认知大模型V1.5开放式问答取得突破,多轮对话和数学能力再升级,文本生成、语言理解、逻辑推理能力持续提升;站长网2023-06-09 21:54:400000Pika Labs发布1.0版AI视频生成器,多风格轻松切换
**划重点:**1.🌈PikaLabs推出全新AI模型,使其视频生成器能够以3D动画、动漫、卡通和电影等不同风格生成和编辑视频。2.💰PikaLabs成功完成5500万美元的融资,由NatFriedman和DanielGross领投,LightspeedVenturePartners领投A轮融资。站长网2023-11-29 10:51:010001认识 Mini-DALLE3:Mini-DALLE3:通过提示大语言模型实现交互式文本到图像生成方法
划重点:-文本到图像模型的快速发展,但在突破自然语言交流方面仍是挑战。-Mini-DALLE3方法允许用户以自然语言规定图像需求,提供反馈,以及提出建议。-该方法通过与大型语言模型互动,改善了图像生成的用户友好性。站长网2023-10-24 23:57:060002厉害了!华为申请注册乾崑大挪移商标
快科技8月12日消息,天眼查知识产权信息显示,近日,华为技术有限公司申请注册一枚乾崑大挪移”商标,国际分类为运输工具,当前商标状态为等待实质审查。今年4月,华为发布了以智能驾驶为核心的智能汽车解决方案新品牌华为乾崑。近期,华为已申请注册乾崑ADS”乾崑智驾”乾崑音响”等多个商标,当前商标状态多为等待实质审查。0000AI潜在风险:AI聊天机器人或成恐怖主义利器
英国的一家恐怖主义监管机构警告说,人类社会可能很快就会开始见证全面爆发的AI辅助的,甚至AI传播的恐怖主义。自2019年以来一直担任英国议会现任独立审查员或恐怖主义立法的乔纳森·霍尔告诉《每日邮报》说道:“我认为完全可以想象,人工智能聊天机器人将被编程,更糟糕的是,传播暴力极端主义意识形态,人工智能支持的攻击可能就在眼前。”站长网2023-04-12 13:23:250001