Runway最强竞争对手来了,一键生成短视频,限时免费开放使用
最近一段时间,AI 作画的水平正在突飞猛进。在 Midjourney、Adobe Firefly 不断布局、落地图片生成技术的同时,有创业公司已经把眼光放到了视频生成上。
本周,推特上出现了不少新 AI 工具生成的短视频,引发了人们关注。这其中既有 AI 生成的「赛博朋克电影预告片」。
也有自然风格的动植物景象:
「日本的旅游风光」。
即使是拿手机去拍摄素材,估计都需要花费不少功夫,然而使用一个叫 Morph Studio 的 AI 来生成,从文字转换成视频只需要几分钟。在社交网络上,试过它的人纷纷点赞,有人还表示或许过不了多久,小成本的独立电影就要用上 AI 技术了。
对于使用者来说,这一轮 AI 生成视频的工具和此前「要革命绘画圈」的 AI 画图类似 —— 都是只需要几个提示词或是一段形容的语句,就可以生成出符合要求的内容,你不需要有多少摄影或绘画基础。简而言之就是毫无创作门槛。
目前,这款工具正在开放免费测试:https://discord.com/invite/2ffQj2UmSP
在 Morph 的官方 Discord 上,我们看到不少人正在尝试生成各种各样的内容:
其中虽然仍然存在一些 AI 风格的魔性图像,但高质量视频的内容已有不少,看起来很接近 AI 画图的水平。
AI 视频生成的赛道上,现在有不少创业公司正跃跃欲试。上个月 Runway 的第二代模型因为可以「从零开始生成视频」火了一把,而在学界,最近 AI 顶会上也不断有使用原图、提示词、草图甚至笔划指令的视频生成方法出现。看起来这一领域距离大规模实用化已经不远了。
前几天有人对几家公司视频生成的生成效果进行了对比,这几个工具使用的都是接近自然语言的提示词。
「独立电影风格、忧郁的眼神」:
「中世纪的骑士,穿着盔甲沐浴在阳光下」:
「海边行驶的跑车,落日在发动机盖上反射出光芒」:
看起来,用同样的 prompt 生成视频,Morph Studio 的效果相对而言是最好的。不论是描绘人物、动物、机械,真实、做旧还是二次元风格,Morph Studio 都能更忠实地反映人们给出的指令,生成更有逻辑且具有一致性的画面,视频内容动作的幅度也相比其他产品更加明显。
有业内人士评价,其产品输出内容的准确率(成功率)一直是领先于 runway 等产品的。此外,Morph的工程师还透露,在最近的一次更新之中,他们会大幅提升模型的单次生成时长,以获得更好的生成效果。
引发人们关注的 Morph Studio,目前还处于创业的早期阶段。这家公司成立于今年4月,在5月刚刚完成了价值数百万美元的种子轮融资。
Morph Studio 应用的方法是纯文本到图像,不借助任何文字以外的信息对视频进行生成,Morph团队的视频生成模型是基于扩散模型训练的。该模型能很好的保证画面的一致性和文字生成的视频的准确性。
从 AI 画图到 AI 生成视频,生成模型产出的内容增加了一整个维度。现在,我们可以通过 AI 演绎出一些简单的情节片段,在最火短视频应用中搞一些创作。这种技术在内容创作、应用场景、甚至商业模式上也可以有很多想象。
而对于 Morph Studio 来说,他们瞄准的是短视频这个应用方向。工程师们表示,目前该公司的目标是做一款面向消费级的社区产品,会先从discord进行技术与需求的验证。
此外,Morph 也计划通过网络社区寻找用户喜欢的主题和社区文化,针对不同主题和内容进行深挖,最终打造 Morph 自己的视频社区。
前不久,AI 画图引发了绘画社区的一场小小的革命,AI 视频能为我们做些什么?这让我们不由得期待起来。
退货 YY ,百度内容 AI 难两全
百度终止收购YY的一纸公告,进一步彰显出其在内容生态上的收缩姿态。在1月1日做出收回36亿美元投资款项的决定之前,早在2023年初,百度内部对YY的收购争议就开始变得越来越大,“觉得当时收购价格偏高,不太合理,(2023年)就一直在想办法,希望能甩掉这块包袱。”了解相关内情的百度员工蔡宇明表示。0000发改委等部门:在新一代信息技术、人工智能等重点行业深度推进产教融合
发改委等部门日前印发《职业教育产教融合赋能提升行动实施方案(2023—2025年)》。站长网2023-06-13 14:24:250001高于市场预期!拼多多2023年第四季度及全年财报公布
快科技3月20日消息,拼多多今日发布了截至12月31日的2023年第四季度及全年财报。具体来看,拼多多2023年Q4营收888.8亿元,市场预期798.74亿元,上年同期398.2亿元;NON-GAAP净利润254.8亿元,同比增110%。第四季度调整后每ADS收益17.32元,市场预期11.28元。0000MosaicML推开源大语言模型MPT-7B-8K 上下文长度达8k
站长之家(ChinaZ.com)7月20日消息:MosaicML发布了名为MPT-7B-8K的7B参数开源语言模型(LLM),支持8K的上下文长度。与以前的模型相比,MPT-7B-8KLLM在摘要和回答任务方面展现出卓越的能力。站长网2023-07-20 18:09:310001「大一统」大模型论文爆火,4种模态任意输入输出,华人本科生5篇顶会一作,网友:近期最不可思议的论文
多模态大模型,终于迎来“大一统”时刻!从声音、文字、图像到视频,所有模态被彻底打通,如同人脑一般,实现了真正意义上的任意输入,任意输出。要知道,多模态一直是学术界公认要达到更强智能的必经之路,连GPT-4都在往这个方向发展。也正是因此,这项来自微软、北卡罗来纳大学教堂山分校的新研究一经po出,立即在社交媒体上爆火,有网友惊叹:这是我最近见过最不可思议的一篇论文!究竟有多不可思议?站长网2023-05-29 09:08:330000