阿里对口型项目EMO开启内测 可将照片转为唱歌视频
站长网2024-04-26 04:10:481阅
千呼万唤始出来!阿里对口型项目EMO终于开启内测了。它能够将一张简单的照片转化为唱歌视频,为用户提供了一种全新的数字人出镜体验。
EMO模型的特点:
简便的操作: 用户只需提供一张照片和克隆的语音模型,即可定制自己的数字人像。
低成本: 与Heygen等需要录制长视频和高算力成本的产品相比,EMO模型提供了一种免费且高效的解决方案。
广泛的适用性: 不仅限于写实人像,3D模型和二次元漫画风格也能生成视频,满足不同用户的需求。
自然的表达: EMO模型在talking head领域首次提出weak condition(弱控制)设计,通过较弱的控制条件引导diffusion去噪过程,生成表情丰富、表现力强的人脸。
技术实现:
EMO模型通过算法pipeline中的face locator和speed layers控制人脸生成区域与人头动作频率,保留了diffusion模型的生成创造能力。
模型在训练中学习音频特征与图像像素的对应关系,放大音频特征对相关像素的影响,确保人物表情口型与音频特征一致。
EMO在250小时的人物讲话视频上训练,不仅匹配了音频中具体发音与人像口型,还发现了音频中的语气特征与人物表情的关联性,将音频中的情绪色彩反映到人物微表情上。
内测链接申请地址:https://www.wjx.top/vm/exOVbr1.aspx#
项目地址:https://top.aibase.com/tool/emo
0001
评论列表
共(0)条相关推荐
小屏党的福音,推荐3款小屏手机,最小的只有4.7英寸
如果您喜欢,可以点击上面的“关注”二字。后续会为您提供更多有价值的内容。参考价格:3759元(4128GB)iPhoneSE3的设计和iPhone8一模一样,乍一看,好像又回到了上一个时代。正面是一块4.7英寸的RetinaHDLCD显示屏,屏幕峰值亮度为625nit。搭载A15芯片,安兔兔跑分在70W左右,日常使用没有问题。站长网2023-04-14 17:01:240000鹿哈7个月挣3500万,直播带货救了“山寨网红”?
还记得去年走红的山寨男团ESO吗?10月7日,前ESO成员“鹿哈”(现已改名凌达乐),因为直播间自曝带货7个月挣3500万登上热搜第一。新播场发现,凌达乐最早在去年12月就开始直播带货,并在今年2月成立了传媒公司。而凌达乐做直播带货最早受到关注,可追溯到今年4月,有媒体报道称当时他一个月带货就达到了3000万。站长网2023-10-08 09:16:090000Hugging Face发布高度优化的Zephyr-7B迷你语言模型 媲美70亿参数Llama-2
**划重点:**1.🌐HuggingFace基于欧洲初创公司MistralAI的开源模型Mistral7B,推出了Zephyr-7B迷你语言模型,并通过蒸馏监督微调(dSFT)方法对其进行了精细优化。2.⚙️Zephyr-7B采用了蒸馏直接偏好优化(dDPO)方法,使用一组“教师”模型的输出作为偏好数据,显著缩短了训练时间,降低了所需资源。站长网2023-11-30 11:25:430001小米回应智能门锁半夜自己开门:正常上锁状态无自动打开可能
日前,有用户反馈称小米智能门锁青春版经常无故自动开门,甚至在半夜也会自动打开。这一情况引起了网友们的广泛关注和讨论。针对这一问题,小米公司发言人”官微进行了回应,并对相关疑问进行了解答。小米表示,经过查实,相关视频中出现的产品采用的是半自动锁体和直插式C级锁芯,不具备锁舌自动收回功能。这种物理结构决定了房门在正常上锁状态下,不可能自动打开,同时该产品也不支持网络远程开锁。0000英国首相将英国定位为全球AI监管大本营
据路透社报道,在伦敦科技周的一次演讲中,英国首相里希·苏纳克表示,英国有可能成为全球AI监管的中心,将把伦敦打造成为行业领先的科技中心,并呼吁英国抓住AI的机遇和挑战。“英国应该不仅成为知识之家,还应该成为全球AI安全监管的地理之家”。站长网2023-06-15 07:10:230001