字节跳动放大招!OmniHuman数字人模型即将上线:一张图+一段音频即可生成视频
站长网2025-02-10 03:06:060阅
快科技2月7日消息,近期,抖音集团旗下图片视频工具即梦AI在官方社交媒体上发布了一条新功能上线预告片。
视频显示,新功能采用了全新的多模态视频生成模型OmniHuman,让用户仅需输入一张图片和一段音频,就可以生成一条生动的AI视频,有望大幅提升AI短片的制作效率和质量。
OmniHuman技术主页信息显示,该模型为字节跳动自研的闭源模型,可支持肖像、半身以及全身等不同尺寸的图片输入,并根据输入的音频,在视频中让人物生成与之匹配的动作,包括演讲、唱歌、乐器演奏以及移动。
对于人物视频生成中常见的手势崩坏,也相比现有方法取得了显著的改善。
此外,对动漫、3D卡通等非真人图片输入的支持效果也较为出色,生成的视频能保持特定风格和原有的运动模式。
根据技术主页展示的演示效果来看,OmniHuman的生成效果已经具有较高的自然度。为防止该项技术被不当利用,字节跳动技术团队在主页中特别标注称,OmniHuman将不会对外提供下载。
即梦AI相关负责人透露,该模型目前已具备较好的表现,但在生成影视真实级别的视频上仍存在一定的提升空间。
由其支持的多模态视频生成功能会在即梦上以小范围内测的形式进行调优调整,并逐步开放。
该负责人同时表示,即梦还会对这一功能设置严格的安全审核机制,并且对输出的视频标注水印以作提醒,从而确保AI发挥正面、积极的作用,助力视频创作者更好地实现想象力的表达。
0000
评论列表
共(0)条相关推荐
宜家AI家居设计和购物助手在 OpenAI GPT 商店上架
划重点:🛋️个性化设计:IKEAAI助手是在GPTStore上推出的首个交互式体验,通过结合GPT技术,为用户提供基于房间尺寸、个人风格、可持续性偏好、预算和功能需求等因素的定制家居设计和购物建议。🌍全球社区分享:助手不仅展示IKEA庞大的产品目录,还允许用户从全球社区的设计灵感和真实家居改造故事中获取启发,同时获得家居专家的建议。站长网2024-02-06 14:34:120003微信收款码不能截图拍照付款!客服回应:建议保存后使用
快科技7月1日消息,今天,一则微信收款码拍下来没法付款”的词条冲上微博热搜,引发了大量热议。有网友称在坐车时拍下了司机的付款码,后续进行支付时提示微信收款码不支持截图使用”。对此,微信支付客服表示,微信收款码不支持截图或拍摄使用,有设置保存收款码”的功能,建议保存后再出示给对方。这样可以实现远程支付,但这种付款方式有额度限制,而且不支持大额付款。站长网2024-07-01 18:15:440000iOS最好用功能,为何成为风险高发区?
昨天,卡巴斯基在混沌通信大会上正式对外公布了苹果设备Triangulation漏洞的调查报告。报告指出,早在今年6月,卡巴斯基就发现了苹果iOS设备中存在相关漏洞,并将其命名其为“OperationTriangulation”。0000马斯克前女友推 AI语音软件 可用她的声音创作歌曲
日前马斯克前女友,也就是歌手ClaireBoucher(艺名Grimes)曾表示,每个人都可以完全自由地使用她的声音的AI生成版本来制作新音乐,并愿意平分版税。站长网2023-05-08 14:08:260000AI 正在改变编程的教学方式:教授们正从语法转向强调更高层次技能
生成式人工智能正在改变软件开发行业。AI驱动的编程工具正在协助程序员完成他们的工作流程,同时AI领域的工作岗位也在持续增加。但这种转变在学术界也很明显——学术界是下一代软件工程师学习编程的主要途径之一。计算机科学的学生正在拥抱这项技术,使用生成式AI帮助他们理解复杂概念,总结复杂的研究论文,集思广益解决问题的方法,提出新的研究方向,当然还有学习如何编程。站长网2024-05-04 12:36:210000








