20151

Sora抢不了谁的饭碗？

站长网2024-03-20 17:03:120阅

2024年开年，OpenAI再次用视频生成模型Sora惊艳了世界。

在 OpenAI 官网分享的演示视频中，Sora 可以直接输出有多个角色、多种场景和运镜的画面。虽然文生视频在概念上并不是新鲜玩意，但和竞争对手相比，Sora的表现用“碾压”来形容也不为过。相比Sora那高清、严谨、时长达到1分钟的视频而言，Runaway网页版产品最长18秒的成绩已经是最强的对手。

图源备注：图片由AI生成，图片授权服务商Midjourney

如此一枝独秀的成绩，彻底引发了世界范围内的行业焦虑。有人认为，国内文生视频领域的实力距离及格线尚有极大差距，同行们表示自家对文生视频领域的发展目标目前尚不清晰。

不过，“焦虑”并非文生视频浪潮中唯一的情绪。

无论是ChatGPT还是Sora，他们引人亢奋的原因在于它极有可能促成全要素生产率的提升。

第一波冲击首先落到了影视行业的头上，用某业内人士的话来说，“业内差一些的编剧作品写得还不如AI”。但时至今日，人工智能的表现并不像许多人预测的一样激进，这使得行业对待文生视频的态度也多了一些审慎的意味。甚至在一些人眼中，人工智能的发展几乎是有百利而无一害的助力，而非挑战。

这次，国内厂商们不跟了

这几天，朋友圈刷屏了腾讯科技对杨植麟、朱啸虎、王小川三位的访谈实录，三者分别代表了业内对于AI的不同看法。其中投资人朱啸虎的核心观点是，咱们搞大模型研发干不过美国，不如把目标放在应用层，降低风险，提高收益。

暂且不提这个观点的对与错，至少从业界的反应来看，ChatGPT发布后，国内迅速掀起了百模大战，但当下愿意下重注跟上Sora的厂商确实寥寥无几。

一方面，这和成本有关。和ChatGPT类似，Sora使用 transformer 架构，将视频和图像表示为称为 Patch 的较小数据单元的集合，类似于 GPT 中的 token。重要的是，它和GPT一样符合AI 缩尺律（Scaling Law），也就是说随着训练计算量的增加，样本质量明显提高。

这也意味着，想要训练出类似效果的文生视频大模型成本同样昂贵。举个例子，1000台服务器的电力成本就高达月20万元，根据纽约时报援引对OpenAI创始人山姆.奥特曼的采访，ChatGPT每天要消耗50万度的电。

而有行业人士表示，Sora 之所以暂未对外开放使用，算力可能是重要的限制原因。

另一方面，即便是Sora，现在的实际效果也并不被看好。根据一些内侧使用者表示，Sora在内容生成上经常出现“幻觉”，比如东京街头漫步视频中，女主角走路过程中出现了腿部变形、腿部交叉换位时错乱。OpenAI的解释是，Sora可能难以准确模拟复杂场景的物理原理。

一些视频行业的从业者们对于现阶段Sora的实用性也表示了怀疑，“首先它很难在短时间内替代一个人，其次它输出的实际效果和市场的需求可能也不太相符合”。

是挑战更是机会

诞生于好莱坞的科技娱乐公司数字王国的CEO谢安表示，对于影视行业的需求而言，人工智能技术无论在文案还是文生视频方面发挥的作用，更多是降本增效而非威胁。

数字王国由一手打造了《泰坦尼克号》《返老还童》等名作的老牌视效工作室演变而来，漫威系列的许多作品也是出自其手，公司对于好莱坞影视制作流程有极其深入的参与。

数字王国常常在一部电影制作的初期流程就参与进来，为作品视觉进行设计、制作相关预演等工作。在这个阶段，AI的运用可以极大的提升工作效率，降低人力成本，将原本可能耗时3个月到半年的工作压缩至一周内。

这一点的实现，与数字王国自身的底蕴也有重要的关系。谢安表示，AI创作依赖优质的素材来源，这正是数字王国的优势之一。成立三十多年来，数字王国深度参与甚至一手包办的视效大片数不胜数，在这过程中不断地充实自身的数字资产。

优秀的AI模型优质数字资产，很容易催生出强大的生产线，更进一步地实现视效设计和制作流程的降本增效。

但另一方面，视效大片对最终呈现效果的要求极高，从概念到设计，再到表演，任何细微的修改都会产生巨大的变化，这种程度的需求是目前的文生视频无法满足的。

换言之，用AI制作让导演满意的分镜脚本很容易，制作电影成片却极难。

因此，像数字王国这样的公司根本不怕被抢走饭碗。

除此之外，数字王国乐见AI技术发展还基于一个独特的原因:对数字王国而言，AI不仅仅是工具，还会是客户。

数字王国在好莱坞以影视视效制作著称，在其拥有的多项优势中，虚拟人技术是一张王牌，电影《复仇者联盟》中的灭霸，《返老还童》中的本杰明·巴顿都是由数字王国操刀的经典案例。

值得重视的是，在这两部电影中，均有演员并未参与拍摄，却出现在了正片中的戏份。

数字王国CEO谢安不久前在一次新闻采访中透露，其实公司已经帮助许多剧组实现了用虚拟人表演的内容，其中既包括主要角色的戏份，也包括群演扮演的路人，为剧组节省了大笔成本。

曾在北京台春晚亮相，引发热议的虚拟人邓丽君，也是数字王国手上的明星产品。

作为数字王国技术研发的重心之一，虚拟人的开发已经形成了一套成熟、高效的系统。谢安表示，只要对一个人进行足够的采样，数字王国可以很快就制作出完成度极高的“数字替身”，其产品完全可以进行商业应用。

在这样的前提下，如雨后春笋般冒出的人工智能模型，就成了数字王国眼中的庞大市场。CEO谢安在采访中表示:“目前成熟的AI模型都是以文字的形式存在，都没有一张‘脸’，想像一下，如果这些AI都有一张用户喜欢的，量身订制的脸，会是怎样的场景?用户过世的亲属，可以依靠虚拟人技术活在数字世界，和新生的后代互动，这又是怎样的光景?它其实是一个很庞大的商机。”