字节跳动放大招!OmniHuman数字人模型即将上线:一张图+一段音频即可生成视频
站长网2025-02-10 03:06:060阅
快科技2月7日消息,近期,抖音集团旗下图片视频工具即梦AI在官方社交媒体上发布了一条新功能上线预告片。
视频显示,新功能采用了全新的多模态视频生成模型OmniHuman,让用户仅需输入一张图片和一段音频,就可以生成一条生动的AI视频,有望大幅提升AI短片的制作效率和质量。
OmniHuman技术主页信息显示,该模型为字节跳动自研的闭源模型,可支持肖像、半身以及全身等不同尺寸的图片输入,并根据输入的音频,在视频中让人物生成与之匹配的动作,包括演讲、唱歌、乐器演奏以及移动。
对于人物视频生成中常见的手势崩坏,也相比现有方法取得了显著的改善。
此外,对动漫、3D卡通等非真人图片输入的支持效果也较为出色,生成的视频能保持特定风格和原有的运动模式。
根据技术主页展示的演示效果来看,OmniHuman的生成效果已经具有较高的自然度。为防止该项技术被不当利用,字节跳动技术团队在主页中特别标注称,OmniHuman将不会对外提供下载。
即梦AI相关负责人透露,该模型目前已具备较好的表现,但在生成影视真实级别的视频上仍存在一定的提升空间。
由其支持的多模态视频生成功能会在即梦上以小范围内测的形式进行调优调整,并逐步开放。
该负责人同时表示,即梦还会对这一功能设置严格的安全审核机制,并且对输出的视频标注水印以作提醒,从而确保AI发挥正面、积极的作用,助力视频创作者更好地实现想象力的表达。
0000
评论列表
共(0)条相关推荐
想让大模型在prompt中学习更多示例,这种方法能让你输入更多字符
站长网2023-09-13 09:29:440000好莱坞多年来一直在扫描群演人脸,AI可能很快取代他们
1.好莱坞使用身体扫描技术创建演员数字复制品。2.群演担心AI会取代他们的工作。3.这种技术的使用可能对电影产业产生深远影响。据美国国家公共广播电台报道,好莱坞的电影群众演员担心人工智能可能会取代他们,因为电影制作中使用身体扫描技术创建演员数字复制品的趋势。站长网2023-08-07 10:29:080000迪士尼续梦元宇宙
纵然今年3月裁撤了整个元宇宙部门,迪士尼对“3D互联网”的布局并没有停下,从云集了虚拟现实、区块链、AI、云计算等新技术的元宇宙宏大叙事中,选择了更具体的切口。最近,迪士尼宣布将与知名NFT系列《NBATopShot》的创作方DapperLabs合作,基于Flow区块链网络推出“数字徽章”平台DisneyPinnacle,该平台还将于今年年底登陆苹果应用商店。站长网2023-11-20 16:05:330000鸿蒙版微信正式上架:首批公测体验名额秒空
今天,微信正式面向鸿蒙系统用户推出了微信鸿蒙原生版,但令人遗憾的是,公测名额在短时间内被迅速抢光。一些博主指出,这次放出的名额仅有几千个,远远无法满足鸿蒙系统用户的热情和需求,他们因此呼吁腾讯增加公测名额。当前版本的微信鸿蒙版支持安卓版微信的大部分功能,包括聊天记录迁移,允许用户将聊天记录无缝转移到新版本中。此外,鸿蒙版微信还支持直接使用系统的原生相机,拍摄高清照片和视频,提升用户的视觉体验。00006.1mm机身塞进10000+mAh电池!荣耀平板V9发布:1999元起
快科技12月16日消息,今日晚间,荣耀平板V9正式发布。售价方面,8128GB首销1999元;8256GB首销2199元;12256GB售价2499元;12512GB售价2799元;8256GB柔光版售价2399元;12256GB柔光版售价2699元。0000