Sora抢不了谁的饭碗?
2024年开年,OpenAI再次用视频生成模型Sora惊艳了世界。
在 OpenAI 官网分享的演示视频中,Sora 可以直接输出有多个角色、多种场景和运镜的画面。虽然文生视频在概念上并不是新鲜玩意,但和竞争对手相比,Sora的表现用“碾压”来形容也不为过。相比Sora那高清、严谨、时长达到1分钟的视频而言,Runaway网页版产品最长18秒的成绩已经是最强的对手。
图源备注:图片由AI生成,图片授权服务商Midjourney
如此一枝独秀的成绩,彻底引发了世界范围内的行业焦虑。有人认为,国内文生视频领域的实力距离及格线尚有极大差距,同行们表示自家对文生视频领域的发展目标目前尚不清晰。
不过,“焦虑”并非文生视频浪潮中唯一的情绪。
无论是ChatGPT还是Sora,他们引人亢奋的原因在于它极有可能促成全要素生产率的提升。
第一波冲击首先落到了影视行业的头上,用某业内人士的话来说,“业内差一些的编剧作品写得还不如AI”。但时至今日,人工智能的表现并不像许多人预测的一样激进,这使得行业对待文生视频的态度也多了一些审慎的意味。甚至在一些人眼中,人工智能的发展几乎是有百利而无一害的助力,而非挑战。
这次,国内厂商们不跟了
这几天,朋友圈刷屏了腾讯科技对杨植麟、朱啸虎、王小川三位的访谈实录,三者分别代表了业内对于AI的不同看法。其中投资人朱啸虎的核心观点是,咱们搞大模型研发干不过美国,不如把目标放在应用层,降低风险,提高收益。
暂且不提这个观点的对与错,至少从业界的反应来看,ChatGPT发布后,国内迅速掀起了百模大战,但当下愿意下重注跟上Sora的厂商确实寥寥无几。
一方面,这和成本有关。和ChatGPT类似,Sora使用 transformer 架构,将视频和图像表示为称为 Patch 的较小数据单元的集合,类似于 GPT 中的 token。重要的是,它和GPT一样符合AI 缩尺律(Scaling Law),也就是说随着训练计算量的增加,样本质量明显提高。
这也意味着,想要训练出类似效果的文生视频大模型成本同样昂贵。举个例子,1000台服务器的电力成本就高达月20万元,根据纽约时报援引对OpenAI创始人山姆.奥特曼的采访,ChatGPT每天要消耗50万度的电。
而有行业人士表示,Sora 之所以暂未对外开放使用,算力可能是重要的限制原因。
另一方面,即便是Sora,现在的实际效果也并不被看好。根据一些内侧使用者表示,Sora在内容生成上经常出现“幻觉”,比如东京街头漫步视频中,女主角走路过程中出现了腿部变形、腿部交叉换位时错乱。OpenAI的解释是,Sora可能难以准确模拟复杂场景的物理原理。
一些视频行业的从业者们对于现阶段Sora的实用性也表示了怀疑,“首先它很难在短时间内替代一个人,其次它输出的实际效果和市场的需求可能也不太相符合”。
是挑战更是机会
诞生于好莱坞的科技娱乐公司数字王国的CEO谢安表示,对于影视行业的需求而言,人工智能技术无论在文案还是文生视频方面发挥的作用,更多是降本增效而非威胁。
数字王国由一手打造了《泰坦尼克号》《返老还童》等名作的老牌视效工作室演变而来,漫威系列的许多作品也是出自其手,公司对于好莱坞影视制作流程有极其深入的参与。
数字王国常常在一部电影制作的初期流程就参与进来,为作品视觉进行设计、制作相关预演等工作。在这个阶段,AI的运用可以极大的提升工作效率,降低人力成本,将原本可能耗时3个月到半年的工作压缩至一周内。
这一点的实现,与数字王国自身的底蕴也有重要的关系。谢安表示,AI创作依赖优质的素材来源,这正是数字王国的优势之一。成立三十多年来,数字王国深度参与甚至一手包办的视效大片数不胜数,在这过程中不断地充实自身的数字资产。
优秀的AI模型 优质数字资产,很容易催生出强大的生产线,更进一步地实现视效设计和制作流程的降本增效。
但另一方面,视效大片对最终呈现效果的要求极高,从概念到设计,再到表演,任何细微的修改都会产生巨大的变化,这种程度的需求是目前的文生视频无法满足的。
换言之,用AI制作让导演满意的分镜脚本很容易,制作电影成片却极难。
因此,像数字王国这样的公司根本不怕被抢走饭碗。
除此之外,数字王国乐见AI技术发展还基于一个独特的原因:对数字王国而言,AI不仅仅是工具,还会是客户。
数字王国在好莱坞以影视视效制作著称,在其拥有的多项优势中,虚拟人技术是一张王牌,电影《复仇者联盟》中的灭霸,《返老还童》中的本杰明·巴顿都是由数字王国操刀的经典案例。
值得重视的是,在这两部电影中,均有演员并未参与拍摄,却出现在了正片中的戏份。
数字王国CEO谢安不久前在一次新闻采访中透露,其实公司已经帮助许多剧组实现了用虚拟人表演的内容,其中既包括主要角色的戏份,也包括群演扮演的路人,为剧组节省了大笔成本。
曾在北京台春晚亮相,引发热议的虚拟人邓丽君,也是数字王国手上的明星产品。
作为数字王国技术研发的重心之一,虚拟人的开发已经形成了一套成熟、高效的系统。谢安表示,只要对一个人进行足够的采样,数字王国可以很快就制作出完成度极高的“数字替身”,其产品完全可以进行商业应用。
在这样的前提下,如雨后春笋般冒出的人工智能模型,就成了数字王国眼中的庞大市场。CEO谢安在采访中表示:“目前成熟的AI模型都是以文字的形式存在,都没有一张‘脸’,想像一下,如果这些AI都有一张用户喜欢的,量身订制的脸,会是怎样的场景?用户过世的亲属,可以依靠虚拟人技术活在数字世界,和新生的后代互动,这又是怎样的光景?它其实是一个很庞大的商机。”
数字王国对市场的判断得到了相当大的支持,近期公司融资超过了8亿元港币。当新的风口既是你的工具,又成为你的市场时,这样的前景也就很难不被看好了。
公众号【内容助推】内测,流量来了!
各位村民好,我是村长前几天刚说完,公众号可以修改已发布文章的标题了。公众号标题可以修改了!还有这8个变化。没想到公众号还偷偷隐藏了一个新功能,就是允许账号付费推广自己发布的文章了,这对于内容创作者来说也是一个好消息。01内容助推上线啦!公众号内测的这个功能叫——内容助推,就是允许创作者选择自己发布过的文章,进行投流,类似dou。而这个功能,在视频号上早就上线了,叫视频加热。站长网2024-07-18 17:05:300000在618“安静”的背后,是本地零售的崛起
今年618可能是有史以来最“安静”的一个电商购物节,安静到可能很多人都没有意识到它发生过。迄今为止,没有一家主流电商平台公布了整体GMV增速——从“传统的”阿里、京东,到近年来新兴的抖音、快手皆是如此,大家最多只公布了几个表现较好的品类增速而已。无论在社交媒体上,还是在我本人周围,618购物节的讨论热度都非常低;我自己甚至就算买东西比较多的了。0000摩尔线程AI创作绘本“摩笔天书”开放邀请测试
摩尔线程宣布AI创作绘本“摩笔天书”已开放邀请测试。该产品是基于摩尔线程全功能GPU开发的AI内容生成解决方案,旨在为用户提供一站式、多模态、全流程、全自动的创作体验。目前开放测试的是“摩笔天书”儿童绘本PCWeb版,用户可通过输入标题和简要的故事大纲,一键生成完整故事、绘本图片、旁白、字幕、背景音乐等素材,并自动合成图文绘本故事和视频绘本故事。站长网2024-01-17 09:36:240002韩国留学生在中国做博主,单月涨粉300万全靠“已读乱回”?
鸡同鸭讲、文化冲击、呆萌可爱、搞笑美女……当这些元素出现在同一个账号里,会发生什么?“基本祐利”(下文简称祐利)给出的答案是:两个月全网涨粉超500万。祐利是一名在中国上学的韩国留学生,经常在生活中受到文化冲击,呆萌的表情配上“塑料”中文,催生了不少搞笑的名场面:医生问她“平时喜欢侧着睡觉吗”,她秒变空耳大师听成“厕所睡觉”;医生说低头她抬头,按摩师让她往后靠她往前伸;站长网2024-05-25 06:37:100000格莱美主席澄清新的人工智能规则:包含 AI 创作元素的音乐完全有资格参与和争夺提名
上个月,美国录音艺术科学学院宣布了一系列的改革,以更好地反映不断演变的音乐行业。其中新设立的指导方针中,涉及到机器学习技术的协议引起了媒体的关注:决定只有「人类创作者」才能获得音乐行业最高荣誉——格莱美奖,旨在限制人工智能在流行音乐中的应用。站长网2023-07-06 14:58:370002