西交大开源SadTalker模型 图片+音频秒变视频!
站长网2023-04-19 15:34:551阅
最近,西安交通大学的研究人员提出了SadTalker模型,通过从音频中学习生成3D运动系数,使用全新的3D面部渲染器来生成头部运动,可以实现图片 音频就能生成高质量的视频。
为了实现音频驱动的真实头像视频生成,研究人员将3DMM的运动系数视为中间表征,并将任务分为两个主要部分(表情和姿势),旨在从音频中生成更真实的运动系数(如头部姿势、嘴唇运动和眼睛眨动),并单独学习每个运动以减少不确定性。最后通过一个受face-vid2vid启发设计的3D感知的面部渲染来驱动源图像。
论文链接:https://arxiv.org/pdf/2211.12194.pdf
项目主页:https://sadtalker.github.io/
研究人员使用SadTalker模型从音频中学习生成3D运动系数,使用全新的3D面部渲染器来生成头部运动。该技术可以控制眨眼频率,音频可以是英文、中文、歌曲。
这项技术在数字人创作、视频会议等多个领域都有应用,能够让静态照片动起来,但目前仍然是一项非常有挑战性的任务。SadTalker模型的出现解决了生成视频的质量不自然、面部表情扭曲等问题。该技术可以应用于数字人创作、视频会议等多个领域。
0001
评论列表
共(0)条相关推荐
度小满与哈工大共建“人工智能(大模型)联合研究中心”
今日,度小满与哈尔滨工业大学宣布共同成立“哈尔滨工业大学-度小满人工智能(大模型)联合研究中心”。双方将围绕大模型基座研发、大模型技术原理及其应用技术等领域展开前沿研究,旨在提升大模型的技术创新能力和实际应用效果。双方还将共同培养生成式人工智能技术领域的领军人才,推动前沿技术的产业化应用加速。站长网2023-06-02 11:58:260006赵丽颖新妆爆火全网,“簪花生意”日入5万?
今生戴花,来世漂亮。一个小渔村,因为簪花的习俗,迎来了新机遇。数据显示,春节期间,以簪花闻名的蟳埔村接待游客36.1万人次,同比增长600%,旅游收入超过7000万元。这阵簪花潮也从春节一直火到了阳春三月,从线下旅拍,延伸出线上的“簪花生意”——在淘宝等电商平台上,仿“泉州簪花围”的饰品月销2000多件,按照108元的客单价算,有商家仅一个SKU就月入20万。0000人工智能初创公司 Morpheme 致力于以对人才友好的方式将人工智能应用到电影和视频游戏配音
人工智能初创公司Morpheme正在通过「数字孪生」技术革新配音。著名配音演员CissyJones和Morpheme的联合创始人旨在改变媒体中的声音表现。这将吸引投资者的兴趣,但同时也会引发有关AI对创意职业影响的担忧。这些担忧在视频游戏行业中更为突出。站长网2023-10-16 14:13:210000综艺又「活」了,长视频如何掀起五月大战?
许久没见的综艺话题屠榜之势,终于随着《乘风2023》的开播,呼啸而来。前脚全网还在被#蔡少芬谢娜Ella好吵#逗笑,后脚就被各位姐姐与姐夫的“爱恨故事”霸屏,而随后“芝芙的越南黑粉”“美依礼芽的二次元粉”进一步推动《乘风2023》话题度赛高。站长网2023-05-10 14:03:360001苹果被曝内部测试AI产品Ajax 盘中市值一度几秒暴增600亿美元
苹果的股票在周三短暂上涨,原因是彭博新闻报道称,该公司正在内部开发自己的人工智能大语言模型。这一举动表明,苹果对人工智能技术的最新进展非常重视,并考虑将其集成到未来的产品中。该公司很少使用“人工智能”这个术语,而是选择更学术的“机器学习”。在过去的一年里,技术人员和投资者都对大语言模型(LLM)这种人工智能技术着迷,它可以生成看起来像人类写的文本或代码。站长网2023-07-20 10:10:110000