南开大学与字节跳动研究人员推出开源AI工具ChatAnything:用文本描述生成虚拟角色
划重点:
1. 🎭 **ChatAnything框架介绍**:南开大学与字节跳动研究人员合作推出一种名为ChatAnything的新型框架,旨在以在线方式生成基于大型语言模型(LLM)的角色的拟人化形象。
2. 🗣️ **MoV和MoD创新概念**:研究团队提出了两个创新概念,即“混合声音”(MoV)和“扩散混合”(MoD),用于实现声音和外观的多样生成。MoV利用文本到语音算法生成预定义音调,而MoD结合文本到图像生成技术和说话头算法简化生成交互式对象的过程。
3. 🧠 **ChatAnything框架的挑战与解决方案**:研究人员在使用当前模型生成的拟人化对象时遇到了检测困难,提出通过像素级引导注入人脸关键点以增加检测率。他们还介绍了ChatAnything框架的四个主要模块,包括LLM控制模块、肖像初始化器、文本到语音模块混合和动作生成模块。
南开大学与字节跳动研究人员合作推出了一项引人注目的研究,发布了一种名为ChatAnything的全新AI框架。该框架专注于通过在线方式生成基于大型语言模型(LLM)的角色的拟人化形象,从而创造具有定制视觉外观、个性和语调的人物。
简答的说,ChatAnything是一个创新的产品,利用语言模型技术为LLM角色创建具有视觉外观、个性和语调的拟人化角色。通过混合语音和外观生成概念,用户只需几个文本输入即可定制角色。该产品采用面部标志控制和评估数据集,通过像素级引导实现更高的人类面部特征生成率。ChatAnything支持文本和图像输入,为用户提供创造独特虚拟角色的自由度。
研究团队充分利用了LLMs的上下文学习能力,通过精心设计的系统提示生成具有个性的拟人化形象。他们提出了两个创新概念:混合声音(MoV)和扩散混合(MoD),以实现声音和外观的多样生成。MoV使用文本到语音(TTS)算法生成预定义音调,根据用户提供的文本描述选择最匹配的音调。而MoD则结合了文本到图像生成技术和说话头算法,简化了生成交互式对象的过程。
然而,研究人员在使用当前模型生成的拟人化对象时遇到了一个挑战,即这些对象通常无法被预先训练的面部关键点检测器检测到,导致面部运动生成失败。为了解决这个问题,他们在图像生成过程中引入了像素级的引导,注入人脸关键点,显著提高了面部关键点检测率,从而实现了基于生成的语音内容的自动面部动画。
研究人员在论文中详细讨论了大型语言模型(LLMs)的最新进展以及它们在上下文学习方面的能力,将它们置于学术讨论的前沿。他们强调了需要一个能够生成具有定制个性、语音和视觉外观的LLM增强人物的框架的重要性。对于个性生成,他们利用LLMs的上下文学习能力,使用文本到语音(TTS)API创建了一个声音模块池,MoV模块根据用户文本输入选择音调。
研究人员进一步介绍了ChatAnything框架的四个主要模块,包括LLM控制模块、肖像初始化器、文本到语音模块混合和动作生成模块。他们通过引入扩散模型、语音变换器和结构控制,创建了一个模块化和灵活的系统。为了验证引导扩散的有效性,研究人员创建了一个包含不同类别提示的验证数据集,并使用预训练的面部关键点检测器评估了面部关键点检测率,展示了他们提出的方法的影响。
ChatAnything框架为生成具有拟人特征的LLM增强人物提供了全面的解决方案。研究人员在解决面部关键点检测方面提出了创新性的解决方案,并在验证数据集中取得了令人鼓舞的结果。这项工作为将生成模型与说话头算法相结合以及改善数据分布的对齐提供了未来研究的可能性。
项目地址:https://chatanything.github.io
相关论文:https://arxiv.org/abs/2311.06772作者:AI_Fox https://www.bilibili.com/read/cv27716378/?jump_opus=1出处:bilibili
网易AI算法、恰似chats手机端应用软件获批登记
天眼查App显示,8月15日,网易(杭州)网络有限公司“网易数帆人工智能算法软件”“恰似chats手机端应用软件”获得登记批准,版本号均为V1.0。资料显示,该公司成立于2006年6月,法定代表人为丁磊,注册资本1.376亿美元,由香港网易互动娱乐有限公司全资持股。站长网2023-08-21 22:16:460000蚂蚁集团正式完成投票权结构调整 变更为无实际控制人
据中国人民银行12月29日消息,人民银行同意支付宝(中国)网络技术有限公司变更为无实际控制人。作为蚂蚁集团的关联公司,恒生电子和国泰产险也于当日发布公告,由于蚂蚁集团股东上层投票权结构调整相关各方已履行程序并完成交割,三家公司均变更为无实际控制人。0000现在公众号插入小店图片可获推荐!
近日微信小店与公众号的打通迎来了新流量激励。现在,在订阅号顶部的工具栏「小店商品」中添加已关联的微信小店商品图片,发布小店相关商品图片即可能获得平台推荐。图片样式如下:在官方发布的《公众号小店商品功能使用规范》中提到,是否能被推荐取决于多项因素(包括是否符合规范的要求等)。如想要查阅是否已实际获得推荐,可通过微信公众号后台的“内容分析-单篇群发”,查看到关于内容推荐情况的详细数据。站长网2024-10-04 14:44:290000公开嘲笑Twitch、闯进美榜Top3,游戏直播头把交椅要易主了?
Kick,大概是2023年初至今海外最为瞩目的游戏直播平台,不仅来势汹汹还高调叫板“老大哥”Twitch。站长网2023-04-14 14:03:070001三星表示需要通过生成式AI升级重新定义其语音助手Bixby
划重点:-💬三星考虑将生成式人工智能技术应用于其语音助手Bixby,以增强设备吸引力。-📱Bixby自2017年推出以来,一直是三星设备的核心工具,但缺乏像ChatGPT等生成式AI的功能。-🤖三星计划通过加入生成式AI功能提升Bixby,实现更自然的对话和更智能的界面,为用户提供更好的体验。站长网2024-04-06 14:18:300000