阿里对口型项目EMO开启内测 可将照片转为唱歌视频
站长网2024-04-26 04:10:480阅
千呼万唤始出来!阿里对口型项目EMO终于开启内测了。它能够将一张简单的照片转化为唱歌视频,为用户提供了一种全新的数字人出镜体验。
EMO模型的特点:
简便的操作: 用户只需提供一张照片和克隆的语音模型,即可定制自己的数字人像。
低成本: 与Heygen等需要录制长视频和高算力成本的产品相比,EMO模型提供了一种免费且高效的解决方案。
广泛的适用性: 不仅限于写实人像,3D模型和二次元漫画风格也能生成视频,满足不同用户的需求。
自然的表达: EMO模型在talking head领域首次提出weak condition(弱控制)设计,通过较弱的控制条件引导diffusion去噪过程,生成表情丰富、表现力强的人脸。
技术实现:
EMO模型通过算法pipeline中的face locator和speed layers控制人脸生成区域与人头动作频率,保留了diffusion模型的生成创造能力。
模型在训练中学习音频特征与图像像素的对应关系,放大音频特征对相关像素的影响,确保人物表情口型与音频特征一致。
EMO在250小时的人物讲话视频上训练,不仅匹配了音频中具体发音与人像口型,还发现了音频中的语气特征与人物表情的关联性,将音频中的情绪色彩反映到人物微表情上。
内测链接申请地址:https://www.wjx.top/vm/exOVbr1.aspx#
项目地址:https://top.aibase.com/tool/emo
0000
评论列表
共(0)条相关推荐
Sora生成火爆短片被指后期特效人工参与 不能保证视频一致性
划重点:-Sora火爆短片《气球人》揭秘:视频并非完全由AI生成,需要人类后期实现大量视觉效果。-视频一致性问题:Sora不能保证不同镜头之间的主体一致性,需要详细描述角色形象来解决。-视频后期处理:Sora生成的视频素材需要人类进行后期裁切、调速、去除不符合设定的元素等处理。站长网2024-04-29 16:59:1500002024年,30%的亚太地区公司将受益于生成式AI技术
日前,福布斯发文预测称,2024年,亚太地区正迎来一个充满探索和潜力的年头,而生成式人工智能(genAI)将成为这一创新浪潮的核心。关于亚太地区的未来,以下是福布斯三个关键预测:站长网2023-10-26 15:31:350000刷爆朋友圈的“闻神”1天涨粉360万,抖音再“造神”普通人?
一个中年男人的怼脸自拍照,在朋友圈刷屏了。你可能没有叔的微信,但微信里一定全是叔的照片和语录。他穿着深色衬衫,发丝还有些许凌乱,一脸严肃正气,搭配上着emo文案比如“我这一生,如履薄冰”“不循环的缘,断不了的念”,一跃成为新一代社交媒体顶流,一天连登四个微博热搜。这个中年男人叫闻会军,来自河北石家庄,表面看起来只是个普通的驾校教练,实际在抖音上有三个不同身份状态:站长网2023-12-20 15:52:130000博通推出高性能、低功耗芯片:迈向人工智能网络之路
站长之家(ChinaZ.com)10月8日消息:芯片制造商博通宣布了其最新进展,承诺加速更高速度光网络技术的推广。在第49届欧洲光通信大会(ECOC2023)上,博通推出了其新的5纳米200G/通道光脉冲振幅调制(PAM)数字信号处理器(DSP),名为SianBCM85822。站长网2023-10-08 10:01:540004滴滴程维:柳青升任永久合伙人 不再设总裁岗位
快科技5月19日消息,滴滴创始人、董事长兼CEO程维与滴滴联合创始人、董事兼总裁柳青联合发布内部全员信,宣布柳青升任公司永久合伙人。同时,柳青不再任董事和总裁,而在未来,滴滴公司也不再设置总裁岗位。升任永久合伙人后,柳青分管的部门和职责不变,并继续担任公司首席人才官,专注在公司人才、组织建设及社会责任工作上,并继续向董事长兼CEO程维汇报。0000