登陆注册
14582

清华阿里等共同开发基于扩散模型的框架DreamTalk 可以让人物头像说话

站长网2023-12-18 16:15:081

DreamTalk是一个由清华大学、阿里巴巴和华中科大共同开发的基于扩散模型的框架,可以让人物头像说话、唱歌并保持嘴唇的同步和模仿表情变化。

项目地址:https://dreamtalk-project.github.io/

这一框架具有以下特点:

DreamTalk能够生成高质量的动画,使人物脸部动作看起来非常真实。

不仅嘴唇动作逼真,还能展现丰富的表情,使得动画更加生动。此外,DreamTalk还支持多种语言,无论是中文、英文还是其他语言,都能很好地同步。

DreamTalk还具有说话风格预测的功能,能够根据语音预测说话者的风格,并同步表情,使得动画更加贴近原始音频。

DreamTalk适用于多种场景,可以用于歌曲、不同类型的肖像,甚至在嘈杂环境中也能表现良好。

DreamTalk是一个具有创新技术的框架,能够为人物头像赋予说话和表情的能力,为多种领域带来更加生动和丰富的体验。

0001
评论列表
共(0)条