阿里对口型项目EMO开启内测 可将照片转为唱歌视频
站长网2024-04-26 04:10:481阅
千呼万唤始出来!阿里对口型项目EMO终于开启内测了。它能够将一张简单的照片转化为唱歌视频,为用户提供了一种全新的数字人出镜体验。

EMO模型的特点:
简便的操作: 用户只需提供一张照片和克隆的语音模型,即可定制自己的数字人像。
低成本: 与Heygen等需要录制长视频和高算力成本的产品相比,EMO模型提供了一种免费且高效的解决方案。
广泛的适用性: 不仅限于写实人像,3D模型和二次元漫画风格也能生成视频,满足不同用户的需求。
自然的表达: EMO模型在talking head领域首次提出weak condition(弱控制)设计,通过较弱的控制条件引导diffusion去噪过程,生成表情丰富、表现力强的人脸。
技术实现:
EMO模型通过算法pipeline中的face locator和speed layers控制人脸生成区域与人头动作频率,保留了diffusion模型的生成创造能力。
模型在训练中学习音频特征与图像像素的对应关系,放大音频特征对相关像素的影响,确保人物表情口型与音频特征一致。
EMO在250小时的人物讲话视频上训练,不仅匹配了音频中具体发音与人像口型,还发现了音频中的语气特征与人物表情的关联性,将音频中的情绪色彩反映到人物微表情上。
内测链接申请地址:https://www.wjx.top/vm/exOVbr1.aspx#
项目地址:https://top.aibase.com/tool/emo
0001
评论列表
共(0)条相关推荐
当慢综艺遇上AI,《我们仨》找到新的爆款密码
《我们仨》这档综艺,属于未播先火的范畴。《我们仨》是由湖南卫视王恬工作室制作,湖南卫视、芒果TV出品的一档AI旅行探索节目。在听说郭麒麟、毛不易、魏大勋要一起做一档综艺时,观众们便忍不住期待起来。毕竟作为综艺界备受欢迎的“三巨头”,他们“插科打诨”与“斗智斗勇”的名场面,均在互联网上留下浓墨重彩的一笔,让人回味至今。站长网2024-03-25 11:25:340000面壁智能多模态大模型「面壁露卡 Luca」面向公众开放服务
面壁智能多模态大模型应用「面壁露卡Luca」正式面向公众开放服务。「面壁露卡Luca」于今年5月正式推出,是面壁智能基于其自研千亿参数基座模型CPM打造的多模态智能对话助手。经过多次迭代更新,Luca不仅在中英文语言对话方面表现出色,还具备强大的代码、知识、逻辑及图片理解能力。站长网2023-11-06 09:34:200001中国好前老板!何小鹏晒与黄仁勋合影:亲送吴新宙去英伟达入职
快科技8月24日消息,就在今日上午,小鹏汽车CEO、创始人何小鹏发布了一张合影,并配文称:原来黄教主每次财报第二天都有全员2小时分享、总结和展望,并经常坦承自己本季度的具体mistake,真不容易!下一个机会在AIGC和AUTO,我们更深入的合作也即将开始。站长网2023-08-24 23:45:440001TomTom 与微软合作开发车载 AI 对话助手只需一次对话交互即可完成所有操作
地图/导航公司TomTom宣布,已与微软合作开发了一款车载人工智能(AI)对话助手。该工具通过增强的语音互动,提升了信息娱乐系统、位置搜索和车辆命令系统的体验,并在一个集成语音AI应用日益增多的一年结束时推出。0001春节正常营业!雷军:任何原因抛锚或事故 小米免费提供道路救援
快科技1月21日消息,雷军公开表示,任何原因抛锚或事故,小米免费提供道路救援。任何原因抛锚或事故,小米免费提供道路救援,并赠送500元打车券(5日有效),免费送车到指定城市。春节期间,小米汽车服务门店正常营业!”按照之前的说法,截至2024年底,小米汽车累计接收的订单已超过26万份,但实际交付量仅约为13.5万辆,占比约为50%。0000