清华阿里等共同开发基于扩散模型的框架DreamTalk 可以让人物头像说话
站长网2023-12-18 16:15:081阅
DreamTalk是一个由清华大学、阿里巴巴和华中科大共同开发的基于扩散模型的框架,可以让人物头像说话、唱歌并保持嘴唇的同步和模仿表情变化。
项目地址:https://dreamtalk-project.github.io/
这一框架具有以下特点:
DreamTalk能够生成高质量的动画,使人物脸部动作看起来非常真实。
不仅嘴唇动作逼真,还能展现丰富的表情,使得动画更加生动。此外,DreamTalk还支持多种语言,无论是中文、英文还是其他语言,都能很好地同步。
DreamTalk还具有说话风格预测的功能,能够根据语音预测说话者的风格,并同步表情,使得动画更加贴近原始音频。
DreamTalk适用于多种场景,可以用于歌曲、不同类型的肖像,甚至在嘈杂环境中也能表现良好。
DreamTalk是一个具有创新技术的框架,能够为人物头像赋予说话和表情的能力,为多种领域带来更加生动和丰富的体验。
0001
评论列表
共(0)条相关推荐
媲美GPT 4!Inflection AI发布Inflection-2.5版本模型 高智商加高情商
InflectionAI公司最近发布了其最新的人工智能模型——Inflection-2.5。这个版本在性能上与GPT4媲美,但仅使用了四成的训练计算量。这一创新展示了InflectionAI在AI领域的高效性和技术创新能力。站长网2024-03-08 13:36:340000HandRefiner:解决AI生图手部畸形难题
HandRefiner是一种可以修正形状不正常的手部图像的方法。在生成图像方面,目前的图像生成模型已经非常出色,但是在生成人类手部的图像时常常会出现问题,例如手指数量不对或者手形怪异。为了解决这个问题,HandRefiner提出了一种条件修补方法,可以在不改变图片其他部分的情况下,修正那些形状不正常的手部图像。站长网2024-01-04 11:30:510000汤姆猫、西湖心辰等在杭州成立人工智能公司
天眼查显示,近日,杭州汤姆猫人工智能科技有限公司成立,注册资本2000万人民币,经营范围包括人工智能应用软件开发、人工智能基础软件开发、人工智能基础资源与技术平台、人工智能公共服务平台技术咨询服务等。此前,“西湖心辰”宣布获得来自“汤姆猫”的战略投资,投资金额过亿元。同时,西湖心辰正式推出自研的通用大模型——“西湖大模型”。站长网2023-07-14 01:57:470000英伟达 H100 GPU 现已对亚马逊 AWS 云服务用户开放
据英伟达官方网站公告,亚马逊云现已正式推出由英伟达H100TensorCoreGPU驱动的全新AmazonElasticComputeCloud(EC2)P5实例。新的EC2P5实例使用户能够通过浏览器轻松扩展生成式AI、高性能计算(HPC)和其他应用。站长网2023-07-30 10:21:540000淘宝新增内容MCN机构管理规范和修改运营指标考核规则
淘宝平台日前发布关于新增《内容MCN机构管理规范》的公示通知。此次规则变更于2023年6月30日公示通知,将于2023年7月8日正式生效。本次更新主要包括新增《内容MCN机构管理规范》、修改《管理规范》中的MCN机构运营指标考核条款,并增加了《机构保证金管理规则》中内容MCN机构2万元档位的缴存标准。站长网2023-07-03 18:21:310000