阿里对口型项目EMO开启内测可将照片转为唱歌视频

站长网2024-04-26 04:10:481阅

千呼万唤始出来!阿里对口型项目EMO终于开启内测了。它能够将一张简单的照片转化为唱歌视频，为用户提供了一种全新的数字人出镜体验。

EMO模型的特点:

简便的操作: 用户只需提供一张照片和克隆的语音模型，即可定制自己的数字人像。

低成本: 与Heygen等需要录制长视频和高算力成本的产品相比，EMO模型提供了一种免费且高效的解决方案。

广泛的适用性: 不仅限于写实人像，3D模型和二次元漫画风格也能生成视频，满足不同用户的需求。

自然的表达: EMO模型在talking head领域首次提出weak condition（弱控制）设计，通过较弱的控制条件引导diffusion去噪过程，生成表情丰富、表现力强的人脸。

技术实现:

EMO模型通过算法pipeline中的face locator和speed layers控制人脸生成区域与人头动作频率，保留了diffusion模型的生成创造能力。

模型在训练中学习音频特征与图像像素的对应关系，放大音频特征对相关像素的影响，确保人物表情口型与音频特征一致。

EMO在250小时的人物讲话视频上训练，不仅匹配了音频中具体发音与人像口型，还发现了音频中的语气特征与人物表情的关联性，将音频中的情绪色彩反映到人物微表情上。

内测链接申请地址:https://www.wjx.top/vm/exOVbr1.aspx#

项目地址:https://top.aibase.com/tool/emo

阿里对口型项目EMO开启内测可将照片转为唱歌视频

0001

评论列表

共(0)条

相关推荐

站长资讯
三星Galaxy Z Flip6、Galaxy Z Fold6发布：尝鲜价顶配16999元
站长之家(ChinaZ.com)7月11日消息:三星电子在昨晚的发布会上，正式揭开了GalaxyZFlip6和GalaxyZFold6两款全新折叠屏手机的神秘面纱。
站长网2024-07-11 09:15:25
0000
站长资讯
元象开源高性能大模型XVERSE-65B-Chat版无条件免费商用
元象宣布开源高性能大模型XVERSE-65B-Chat版，无条件免费商用，为开发者构建和部署垂直领域应用提供强大且易用的工具。广大用户可登录大模型官网（chat.xverse.cn）或小程序体验。XVERSE-65B在SuperCLUE中文通用大模型综合基准测评中位居国内开源总分第一。
站长网2023-12-15 08:48:44
0000
站长资讯
推特大楼X新标志遭拆除被邻居投诉亮度太大
周末，埃隆·马斯克在旧金山为X公司（XCorp.）选定了位置，在推特公司总部的顶部竖起了一个巨大的发光X标志。周一，有工人正在拆除了发光的X标志，移走了它的灯光和字母的一条臂，这座建筑在邻居和市政官员中引起了批评。到下午1点，标志已经从屋顶上移走了。
站长网2023-08-01 08:56:18
0000
站长资讯
OpenAI公布安全系统确保AI大模型安全可靠
今日，OpenAI公布了公司在安全方面的举措。OpenAI表示，其安全系统团队处于确保当今现实世界中人工智能模型安全性和可靠性的最前沿。安全系统团队致力于确保人工智能模型及其在现实世界中的部署的安全性、稳健性和可靠性。他们通过实践和研究来解决安全问题，并开发基本解决方案，以确保人工智能的安全和值得信赖。安全团队包括安全工程、模型安全研究、安全推理研究和人机交互等多个小组:
站长网2023-12-06 08:59:57
0000
站长资讯
华为理想懵了！何小鹏：为什么说小鹏的智驾才是真正全国都能开
快科技7月26日消息，小鹏将于本月底举行AI智驾技术发布会，今日小鹏汽车CEO何小鹏回答了为什么说小鹏的智驾才是真正全国都能开?”何小鹏称，现在市场上有不同的高阶自动驾驶解决方案，因为很多方案都是我们曾经经历过的，因此很多鹏友横向测试看到不同结果是很正常的。算法规则时代：
站长网2024-07-26 17:58:10
0001