四大AI视频工具“斗法” 一文教你怎么玩
AI视频工具赛道越来越卷,各种升级令人应接不暇,尤其是Gen-2、Pika1.0、Stable Video Diffusion、和Magic Animate,它们正在成为用户最常用的视频生成产品,背后有强大的AI大模型支撑。
尽管目前的视频类大模型还达不到“用文字描述一个故事就能生成一部电影”这么高能,但已经能通过一系列提示词就能创作出一段生动的视频,还发展出图生视频等强大的多模态能力。
《元宇宙日报》测试了四大AI视频工具,希望能帮你快速上手体验。需要提醒的是,所有的工具输入提示词时最好使用英文,生成效果会比中文提示要好。在此,我们也希望国产的AI视频生成工具能快点赶上,创造出适合中文用户的好产品。
Runway Gen-2
Gen-2是第一款公开可用的文本生成视频工具,由Runway Research开发。它的相关功能,包括文本/图像转视频、视频风格化、图像拓展、一键扣除视频背景、抹除视频指定元素、训练特定AI模型等,可以说是目前最强的AI视频生成/编辑工具。
Gen-2的文本生视频功能相对Gen-1已经有了相当大的提升,这里可以看下输入“raccoon play snow ball fight in sunny snow Christmas playground”(浣熊在阳光明媚的雪地圣诞游乐场打雪仗)的生成效果。可以说,无论是画质还是构图,Gen-2都十分出色。但会出现遗漏关键词的问题,比如画面中没有体现出“圣诞”与“打雪仗”的效果。
就在前几天,Runway又上线了新功能“Motion Brush”(运动笔刷),我们只需在图像上涂抹一个区域,就能将静态的图像变为动态内容。“运动笔刷“的功能在操作上太友好了,选定一张图片,使用笔刷涂抹想要动起来的区域,再调试好想要大致的运动方向,静止的图片就可以根据预定动起来。
来看一下效果:
但目前,“运动笔刷”的功能也存在一些不足,比如适合缓慢的移动画面,无法生成类似车辆飞速行驶等快速移动的画面。此外,如果使用运动笔刷,涂抹外的区域都几乎保持静止,无法实现多个物体运动轨迹的微调。
目前,Runway免费账号只能生成4秒时长的视频,每秒需要消耗5个积分,最多可以生成31个视频,并且不能去除水印。如果你想要更高分辨率、无水印、时长更长的视频,那就需要付费升级一下你的账号。
此外,如果你想学习AI视频,可以试试Runway推出的电视频道Runway TV,这里24小时循环播放由AI制作的视频,通过这些AI视频,你或者还能寻找一些创意灵感。
网站定位:
https://app.runwayml.com/video-tools/teams/wuxiaohui557/ai-tools/gen-2
Pika1.0
Pika1.0是Pika Labs发布的第一个正式版产品,这个实验室是由华人团队创办的AI技术初创公司。Pika1.0不仅能够生成3D动画、动漫、卡通和电影,甚至可以实现风格转换、幕布扩展、视频编辑等重磅能力。Pika1.0非常擅长制作动漫风格的画面,可生成电影效果的短视频。
Pika1.0最受网友欢迎的小工具当属“AI魔法棒”即局部修改功能。放在几个月前,这是AI绘画领域才刚刚拥有的能力,现在“局部修改”能够修改视频中所有背景、主体的局部特征,而且实现起来也很便捷,只需要三步:上传动态视频;在Pika的控制台内选择要修改的区域;输入提示词,告诉Pika你想用什么来代替它。
除了“局部修改”功能,Pika1.0将文生图工具Midjourney具备的“图像拓展”功能带到了视频界,这是视频AI生成工具的首次。不同于在抖音上被玩坏的“AI扩图”,Pika1.0的视频拓展相当靠谱,不仅画面自然,而且十分符合逻辑。
目前,Pika1.0支持用户免费体验,但需要申请试用名额。如果你还在排队的话,可以在官网选择Discord登陆看看。与Midjourney类似,用户需要在Discord进行云端创作,而且可以体验到文本-视频、图片-视频两大功能。
进入Pika1.0的Discord服务器后,点击Generat中的任意一个频道,输入“/”,选择“Create”,在弹出的prompt文本框中输入提示词即可。
与Gen-2相比,Pika1.0对提示词的理解更加到位,但在画质还不如Gen-2,这很可能是因为云创造的缘故,我们来看下效果:
,时长00:03
如果用图片生成视频,则输入“/”后,选择“animate”,上传一张图片,输入提示词说明即可。
Pika1.0的图片-视频效果与Gen-2不相伯仲,看下效果:
网站定位:
https://pika.art/waitlist
Stable Video Diffusion
11月22日Stability AI发布了一个AI生成视频的开源项目:Stable Video Diffusion(SVD),Stability AI官方博客显示,全新SVD支持文本到视频、图像到视频生成,并且还支持物体从单视角到多视角的转化,也就是3D合成。生成效果不亚于Runway Gen2和Pika1.0。
目前有两种在线使用途径,一个是官方在replicate上发布的试玩demo,一个是新出的在线网站,两者均免费。
我们测试了第一种,因为它支持参数调整,操作也相对便捷:上传图片,调整帧数、画面纵横比、整体运动等参数即可。但美中不足的是,画面生成效果相对随机,需要不断调试来达到想要的效果。
看看效果:
Stable Video Diffusion目前只是基础模型,尚未产品化,但官方透露“正计划继续扩展,建立类似于Stable Diffusion的生态系统”,计划根据用户对安全和质量的反馈持续改进模型。
网站定位:试玩 demo 版和在线版
https://replicate.com/stability-ai/stable-video-diffusion
https://stable-video-diffusion.com/
Magic Animate
MagicAnimate是一种基于扩散模型的人像动画生成方法,旨在增强时间一致性、保持参考图像的真实性,并提高动画保真度,由新加坡国立大学Show Lab和字节跳动联合推出。
简单来说,给定一张参考图像和一个姿态序列(视频),它可以生成一个跟随姿态运动,并保持参考图像身份特征的动画视频。操作也是非常简单,同样只需三步:上传一张静态人物照片;上传想要生成的动作demo视频;调整参数。
MagicAnimate在GitHub中也给出了本地体验的方式感兴趣的小伙伴可以试试!
网站定位:
https://github.com/magic-research/magic-animate
研究:大多数企业看好使用生成式人工智能进行颠覆,但低估了需求
划重点:⭐️全球调查发现,大多数企业希望利用生成式人工智能(AI)颠覆其行业,但只有少数认为他们拥有足够支持其快速采用的技术水平和其他要素。⭐️调查发现,企业对生成式AI的快速采用存在低估,这可能导致他们在部署过程中遇到困难,无法实现他们作为颠覆者的计划。⭐️调查显示,企业需要解决IT不足等问题,否则可能无法实现他们对生成式AI的雄心。站长网2024-03-05 16:12:520000中国版FSD要来了!特斯拉和百度地图深度定制车道级高辅地图:已获批
快科技4月30日消息,日前,关于百度于特斯拉合作实现中国版FSD的消息引起广泛关注。虽然官方还没正式官宣,但是种种迹象已经表明了双方的合作关系。甚至还有媒体在自然资源部网站上发现,除了用于车机导航服务的《百度车机地图》(T版),百度地图近期也有多个《高级辅助驾驶地图》获得自然资源部批准。站长网2024-05-01 14:26:490000小米14 Ultra将推出钛合金特别版:配有铝制框架 拥有三种存储版本
快科技2月15日消息,近日,有消息称小米14Ultra将推出钛合金特别版,且该手机将配备有铝制框架。据爆料,小米14Ultra将标配金属中框,还在准备钛合金特别版,就如之前的小米14Pro版本策略一样。消息还称小米14Ultra将在国内推出三存储版本,分别是12GB256GB、16GB512GB、16GB1TB,国内没有24GB内存版本。站长网2024-02-16 09:37:400000IBM利用生成式 AI提升COBOL应用程序现代化
IBM近日宣布,利用生成式AI大语言模型(LLM)的力量,将古老的COBOL应用程序引入现代时代。虽然COBOL在编程领域不再被普遍视为领先的编程语言,但仍有数十亿行COBOL代码在生产应用程序中运行,其中一部分运行在IBM的大型机系统Z上。站长网2023-08-22 14:57:210000一场私域大败局的反思
这是一家“出道即巅峰”的公司,但疫情过后,却没能幸免于难,也进行了关店撤城和破产清算。该事件也曾在行业中闹的沸沸扬扬,见实此前约到了其新流量中心的负责人吴大帅,探讨了如下问题:从一线人员的角度来看,究竟是什么因素造成了公司的破产?内部人员怎么看这次事件?其私域运营负责人怎么看过去的运营?现在对私域运营又有哪些新认知?0000