Sora抢不了谁的饭碗?
2024年开年,OpenAI再次用视频生成模型Sora惊艳了世界。
在 OpenAI 官网分享的演示视频中,Sora 可以直接输出有多个角色、多种场景和运镜的画面。虽然文生视频在概念上并不是新鲜玩意,但和竞争对手相比,Sora的表现用“碾压”来形容也不为过。相比Sora那高清、严谨、时长达到1分钟的视频而言,Runaway网页版产品最长18秒的成绩已经是最强的对手。
图源备注:图片由AI生成,图片授权服务商Midjourney
如此一枝独秀的成绩,彻底引发了世界范围内的行业焦虑。有人认为,国内文生视频领域的实力距离及格线尚有极大差距,同行们表示自家对文生视频领域的发展目标目前尚不清晰。
不过,“焦虑”并非文生视频浪潮中唯一的情绪。
无论是ChatGPT还是Sora,他们引人亢奋的原因在于它极有可能促成全要素生产率的提升。
第一波冲击首先落到了影视行业的头上,用某业内人士的话来说,“业内差一些的编剧作品写得还不如AI”。但时至今日,人工智能的表现并不像许多人预测的一样激进,这使得行业对待文生视频的态度也多了一些审慎的意味。甚至在一些人眼中,人工智能的发展几乎是有百利而无一害的助力,而非挑战。
这次,国内厂商们不跟了
这几天,朋友圈刷屏了腾讯科技对杨植麟、朱啸虎、王小川三位的访谈实录,三者分别代表了业内对于AI的不同看法。其中投资人朱啸虎的核心观点是,咱们搞大模型研发干不过美国,不如把目标放在应用层,降低风险,提高收益。
暂且不提这个观点的对与错,至少从业界的反应来看,ChatGPT发布后,国内迅速掀起了百模大战,但当下愿意下重注跟上Sora的厂商确实寥寥无几。
一方面,这和成本有关。和ChatGPT类似,Sora使用 transformer 架构,将视频和图像表示为称为 Patch 的较小数据单元的集合,类似于 GPT 中的 token。重要的是,它和GPT一样符合AI 缩尺律(Scaling Law),也就是说随着训练计算量的增加,样本质量明显提高。
这也意味着,想要训练出类似效果的文生视频大模型成本同样昂贵。举个例子,1000台服务器的电力成本就高达月20万元,根据纽约时报援引对OpenAI创始人山姆.奥特曼的采访,ChatGPT每天要消耗50万度的电。
而有行业人士表示,Sora 之所以暂未对外开放使用,算力可能是重要的限制原因。
另一方面,即便是Sora,现在的实际效果也并不被看好。根据一些内侧使用者表示,Sora在内容生成上经常出现“幻觉”,比如东京街头漫步视频中,女主角走路过程中出现了腿部变形、腿部交叉换位时错乱。OpenAI的解释是,Sora可能难以准确模拟复杂场景的物理原理。
一些视频行业的从业者们对于现阶段Sora的实用性也表示了怀疑,“首先它很难在短时间内替代一个人,其次它输出的实际效果和市场的需求可能也不太相符合”。
是挑战更是机会
诞生于好莱坞的科技娱乐公司数字王国的CEO谢安表示,对于影视行业的需求而言,人工智能技术无论在文案还是文生视频方面发挥的作用,更多是降本增效而非威胁。
数字王国由一手打造了《泰坦尼克号》《返老还童》等名作的老牌视效工作室演变而来,漫威系列的许多作品也是出自其手,公司对于好莱坞影视制作流程有极其深入的参与。
数字王国常常在一部电影制作的初期流程就参与进来,为作品视觉进行设计、制作相关预演等工作。在这个阶段,AI的运用可以极大的提升工作效率,降低人力成本,将原本可能耗时3个月到半年的工作压缩至一周内。
这一点的实现,与数字王国自身的底蕴也有重要的关系。谢安表示,AI创作依赖优质的素材来源,这正是数字王国的优势之一。成立三十多年来,数字王国深度参与甚至一手包办的视效大片数不胜数,在这过程中不断地充实自身的数字资产。
优秀的AI模型 优质数字资产,很容易催生出强大的生产线,更进一步地实现视效设计和制作流程的降本增效。
但另一方面,视效大片对最终呈现效果的要求极高,从概念到设计,再到表演,任何细微的修改都会产生巨大的变化,这种程度的需求是目前的文生视频无法满足的。
换言之,用AI制作让导演满意的分镜脚本很容易,制作电影成片却极难。
因此,像数字王国这样的公司根本不怕被抢走饭碗。
除此之外,数字王国乐见AI技术发展还基于一个独特的原因:对数字王国而言,AI不仅仅是工具,还会是客户。
数字王国在好莱坞以影视视效制作著称,在其拥有的多项优势中,虚拟人技术是一张王牌,电影《复仇者联盟》中的灭霸,《返老还童》中的本杰明·巴顿都是由数字王国操刀的经典案例。
值得重视的是,在这两部电影中,均有演员并未参与拍摄,却出现在了正片中的戏份。
数字王国CEO谢安不久前在一次新闻采访中透露,其实公司已经帮助许多剧组实现了用虚拟人表演的内容,其中既包括主要角色的戏份,也包括群演扮演的路人,为剧组节省了大笔成本。
曾在北京台春晚亮相,引发热议的虚拟人邓丽君,也是数字王国手上的明星产品。
作为数字王国技术研发的重心之一,虚拟人的开发已经形成了一套成熟、高效的系统。谢安表示,只要对一个人进行足够的采样,数字王国可以很快就制作出完成度极高的“数字替身”,其产品完全可以进行商业应用。
在这样的前提下,如雨后春笋般冒出的人工智能模型,就成了数字王国眼中的庞大市场。CEO谢安在采访中表示:“目前成熟的AI模型都是以文字的形式存在,都没有一张‘脸’,想像一下,如果这些AI都有一张用户喜欢的,量身订制的脸,会是怎样的场景?用户过世的亲属,可以依靠虚拟人技术活在数字世界,和新生的后代互动,这又是怎样的光景?它其实是一个很庞大的商机。”
数字王国对市场的判断得到了相当大的支持,近期公司融资超过了8亿元港币。当新的风口既是你的工具,又成为你的市场时,这样的前景也就很难不被看好了。
YouTube 整合 AI 驱动的配音工具 Aloud:将视频自动配音成其他语言
YouTube正在测试一项新工具,利用人工智能帮助创作者将他们的视频自动配音成其他语言。该公司在VidCon上宣布与AI动画配音服务Aloud合作,后者是谷歌旗下孵化器Area120的一部分。站长网2023-06-25 23:41:080000弹幕互动直播有哪些新机遇?平台、公会及厂商这么说......
8月4日,新播场在长沙举办了一场弹幕互动直播公会交流会。本次交流会邀请了快手、腾讯、淘宝直播等多家平台,OST娱乐等多家头部公会,以及傲宇互娱、众邀互动等多家头部弹幕游戏厂商。本次活动共有三个环节:平台分享、公会分享和厂商分享。不同身份的玩家齐聚一堂,不仅共同探讨了弹幕互动玩法爆火的核心逻辑,还分析了弹幕互动会带给娱乐直播行业发展的机遇。站长网2023-08-08 14:03:180002OpenAI前CTO被曝吸金7亿创业,招聘首先挖角老东家
OpenAI前CTOMiraMurati出走后,动向进一步明确——被曝筹备新公司,吸金超1亿美元(约合7亿人民币),且和她同一天离开OpenAI的BarretZoph(前研究副总裁)也可能入局。此前就有消息称,Mira离职后一直在向前司OpenAI的员工抛出橄榄枝。虽然具体创业方向并未明确,但人们已经开始为OpenAI捏一把汗了,竞争对手1??不仅如此,OpenAI最近抓马持续:0000播客的时运:从小众到“每一年都是元年”
01一个老播客迷的播客往事其实,我是一个老播客听众了,如果当年musicradio那些节目也被算作为播客的话。中学时代,我就是边听musicradio边做题。那时候网络欠发达,还用小灵通,很多新歌首发都在音乐之声。那时候的广播节目,有资源,有市场影响力。但不同于美国这个车轮上的国家,中国的收音机这个媒介,几乎从来没有真正意义上成为过大众媒介。0000主理人站上C位,小红书电商又起风了
价格力退潮,电商行业的风向变了去年以来,头部电商平台开始执行低价策略,价格力逐渐成为电商行业的基础性武器。但最近一段时间,行业的风向发生了变化,各大平台陆续调转船头,不再强调价格力的核心地位了。比如今年618后,淘天集团在一场面向商家的闭门会议中明确了下半年的变化,其中包括减少对“五星价格力”的依赖,弱化绝对低价的策略,重新回到GMV的流量分配逻辑。站长网2024-08-01 10:52:290000