AI视频生成的2024,Sora务虚、即梦和可灵务实
自从ChatGPT成为有史以来最快突破亿级用户规模的消费级应用,AI行业的大变局就到来了。随后大家开始谈起了AI会给人类社会带来的深刻变革与挑战,比尔·盖茨甚至认为AIGC(生成式人工智能)的重要性不亚于互联网的发明,将改变我们的世界。
两年时间过去后,AI确实改变了许多东西,只不过这种改变或许与大家最初设想的不太一样,因此也难怪有人调侃是AI在“写诗作画”、人类却还在“当牛做马”。一个令人哭笑不得的现实是,刚刚过去的2024年,AIGC几乎彻底改变了互联网的内容生态。
有一个很有趣的现实,是长文本、文生图、文生视频等引人瞩目的爆点,几乎都发生在文艺领域。其实这是因为在AI尚未进化为AGI的情况下,越是非标准化的评价体系,AI就越容易“浑水摸鱼”。正所谓“画鬼容易画人难”,说的其实就是这个问题,毕竟鬼谁也没见过,所以可以随便画,但人就不行,一旦出现偏离很容易会被发现。
文艺领域不谈对错、只有好坏的现实,就让大模型更加如鱼得水,以至于在抖音、快手、YouTube、X、Instagram等平台上,AIGC内容已然泛滥。当然,这一切其实少不了这些平台方的顺势而为,虽然AIGC内容会污染内容生态,但这并不代表相关互联网厂商就会对其严防死守。
毕竟互联网厂商与唱片商、新闻出版机构不一样,它们并不用担心AI会颠覆自己,反而认为AI是促成内容生态进行迭代的“鲶鱼”。如果说2023年互联网圈对于AIGC内容的态度还是“控制使用”,那么到了2024年则是“全面拥抱”,堪称是180度的大转弯。而这一变化的契机,则是OpenAI放出的文生视频模型Sora。
此前在2023年,各大厂商其实就已经开始探索基于ChatGPT衍生的文生文类应用,比如谷歌就被曝出会带来一款借助AI技术制作新闻报道的产品“Genesis”,其能够接收时事信息、并自动生成稿件。可遗憾的是,使用AI进行内容创作的网站无一例外都失败了,美国媒体甚至用“新闻灾难”来形容这一行为。
可反观OpenAI在2024年伊始放出的Sora,它不仅能生成一分钟的连贯、高清视频,且具有极强的仿真能力,还展现出了对物理世界的初步理解。紧接着快手的可灵与抖音的即梦在短时间内迅速落地,由此文生视频工具之战也正式打响。
为什么文生视频要比文生文更受互联网厂商的重视呢?答案其实很简单,因为文生文并不是什么新鲜事,早在AIGC技术出现之前,基于自动化脚本的内容农场(Content Farm)、社交机器人(Social media bots)就已经在互联网上泛滥。由于文字信息密度更高的特点,用户会很容易就察觉出相关内容有“AI味”,而视频的信息密度相对较低,所以用户就更容易被“糊弄”过去。
对于短视频平台而言,文生视频工具则堪称是意义重大。早在2019年夏季,抖音的剪映和快手的快影也曾来过一次与如今即梦和可灵类似的同台竞技,但视频编辑工具之争背后,则是从2019年开始互联网流量红利不再,再加上短视频经过三年的野蛮生长后,UGC的潜力被挖掘殆尽,所以抖音和快手不得不寄希望于专业的创作者。
相比于Adobe Premiere Pro等传统视频编辑工具更简单、高效的剪映和快影背后,其实是抖音与快手想要通过技术手段提升用户制作短视频的效率和质量,从而让更多的优质内容涌现。从2019年到2024年这五年时间里,抖音、快手的内容生态也发生了天翻地覆的变化,个人创作者开始让位于专业的MCN。
可是随着短视频平台用户规模的不断膨胀,MCN主导的PUGC模式在产能上与用户需求无法匹配,所以抖音和快手不得不回过头来重新审视UGC。而文生视频、乃至图生视频的意义,就在于降低用户的创作门槛,这也就意味着以往只对热点敏感、却不具备视频制作能力的创作者也能“入行”了,即便用户对于视频剪辑完全没有了解,只靠即梦、可灵就能把创意变成视频。
快手视觉生成与互动中心负责人万鹏飞在公开场合就曾谈及可灵的未来,“视频创作的门槛和效果的ROI大幅度提升,视频创作者和消费者界限逐渐模糊。越来越多消费者变成创作者,对于视频创作生态的繁荣是非常有价值的”。所以模糊内容创作者与内容消费者的界限,让更多的用户在这两种身份之间随时切换,就是抖音和快手的目的。
现实正如抖音和快手所预期那般,AIGC确实重塑了短视频平台的内容生态,“万物皆可羊毛卷”、“巫师猫”、“APT可爱版”等基于AI实现的内容创作体裁蔚然成风。当初在Sora问世之后,一众媒体都曾惊呼OpenAI或将改变视频创作的格局,“创作平权”的时代即将到来。
结果真正改变视频创作的是抖音和快手,而非在去年圣诞节期间才让Sora正式亮相的OpenAI。但这不是因为Sora正式版不强,而是作为一家技术型企业,OpenAI缺乏内容生态。从某种意义上来说,OpenAI的Sora与抖音即梦、快手可灵的分野,就反映了太平洋两岸科技圈不同的特点,即硅谷长于理论、而国内则胜于将理论转化为实际。
MLCommons推出新平台评估AI医疗模型
近年来,医疗行业积极拥抱人工智能,尤其在疫情的推动下。根据Optum的一项调查显示,80%的医疗机构已经制定了人工智能战略,另有15%计划启动相关项目。为满足需求,包括大型科技公司在内的供应商纷纷推出相关产品。站长网2023-07-18 19:02:010000微软工程师工资曝光!AI部门平均270万远超其他部门
快科技8月25日消息,据媒体报道,数百名微软员工自愿分享了他们的薪资和晋升信息,其中包括超过500名美国员工的详细数据。分析这些数据后发现,微软软件工程师的平均薪酬范围很广,从148436美元到1230000美元不等,对应着从Level59到Level69的职位级别。0000谷歌AI研究提出利用大语言模型生成个性化文本通用方法
本文概要:1.使用多阶段多任务结构,包括检索、排序、摘要、合成和生成,训练法学硕士进行个性化文本生成。2.引入辅助任务来提高大型语言模型的阅读能力,通过识别文本作者来改善模型的解释能力。3.在三个公开数据集上验证了该方法的性能,结果显示在所有数据集上相较于基准模型,多阶段多任务框架都取得了显著的改进。最近,谷歌AI研究团队提出了一种利用大型语言模型进行个性化文本生成的通用方法。站长网2023-08-22 21:43:040000比你领先还比你卷!年底的Sam Altman还在四处搞钱,疯狂搞人
临近年底,美国大街小巷都沉浸在浓浓的节日氛围里,科技大厂按例shutdown,员工们也已纷纷躺平,进入双旦休假模式。不过有一个人,他是根本停不下来,反而像上了发条,开始了12月疯狂加速计划。这个人就是我们的老朋友——2023AI圈话题之王、人工智能当红炸子鸡、OpenAI首席执行官SamAltman。奥特曼搞钱搞人尾牙忙不停0000三星和 SK 加快人工智能半导体的开发以应对 ChatGPT
三星电子和SK海力士正在加快下一代半导体技术的开发,以适应人工智能(AI)时代的到来,而ChatGPT的出现更加加速了这个过程。据业内消息称,三星电子最近开发了业内首款支持ComputeExpressLink(CXL)2.0的128GBCXLD-RAM。站长网2023-05-15 17:52:390000