商汤科技提出Story-to-Motion:从长文本生成人体运动轨迹
要点:
人工智能在动画、游戏和电影领域的应用中,从长篇文本中生成自然人类运动是一个复杂而困难的任务。研究团队提出了一种新的方法,通过三个主要组件,即文本驱动的运动调度、文本驱动的运动检索系统和渐进式掩蔽变换器,成功解决了这一挑战。
提出的方法通过引入轨迹和语义,能够从长篇文本中生成全面的运动,从而解决了“故事到运动”问题。特别地,文本驱动的运动匹配为准确、可定制的运动合成提供了新方法。在多个子任务上的实验证明,该方法在轨迹跟踪、时间动作组合和运动混合方面优于现有技术。
该系统代表了从文本叙述中合成人类运动的重大进展,将在动画、游戏和电影行业产生深远的影响。它为“故事到运动”任务提供了全面解决方案,具有改变行业格局的潜力。
人工智能正逐渐渗透到各行各业,其中一项重要的进展是通过长篇文本生成自然人类运动,这在动画、游戏和电影等领域具有巨大潜力。然而,从文本到运动的转化一直是一个巨大挑战,尤其是在处理角色在不同区域移动和执行特定动作时。
尽管过去已经付出了大量努力来研究文本到运动和角色控制,但迄今为止尚未找到合适的解决方案。现有的角色控制方法存在许多限制,无法处理文本描述,而当前的文本到运动方法则需要更多的位置约束,导致生成不稳定的运动。
项目地址:https://story2motion.github.io/
为了应对这些挑战,研究团队提出了一种独特的方法,该方法通过三个关键组件解决了“故事到运动”的问题。首先是文本驱动的运动调度,它利用现代大型语言模型从长篇文本中提取文本、位置和持续时间对,作为文本驱动的运动调度器,确保生成的运动基于故事并包含有关每个动作的位置和长度的详细信息。
其次是文本驱动的运动检索系统,通过将运动匹配和对运动轨迹和语义的约束相结合,创建了一个全面的运动检索系统,确保生成的运动满足预期的语义和位置属性以及文本描述。最后是渐进式掩蔽变换器,它专门设计用于处理过渡运动中的常见伪影,如脚滑动和不寻常的姿势,以提高生成运动的质量,产生更平滑的过渡和更真实的外观。
这一方法经过了在运动混合、时间动作组合和轨迹跟踪等三个子任务上的测试,结果显示在每个领域都优于先前的运动合成技术。
研究人员总结了他们的主要贡献,包括引入轨迹和语义以从长篇文本生成全面的运动,提出了一种新方法——基于文本的运动匹配,以提供准确和可定制的运动合成,并在轨迹跟踪、时间动作组合和运动混合子任务上的实验证明其优于现有技术。
总的来说,这个系统标志着从文本叙述中合成人类运动的一大步前进。它不仅为“故事到运动”任务提供了完整的解决方案,还在动画、游戏和电影等行业中具有革命性的影响。这项研究的成果为人工智能技术在创意产业中的应用开辟了新的可能性,有望为相关领域带来巨大的发展。
Apple Intelligence存重大安全缺陷,几行代码即可攻破!Karpathy发文提醒
【新智元导读】AppleIntelligence上线在即,一小哥几行代码曝出AppleIntelligence安全缺陷。在2024年全球开发者大会(WWDC)上,Apple发布了将搭载在iOS18.1中的AI功能AppleIntelligence。眼看着10月即将正式上线了,有「民间高手」在MacOS15.1提供的Beta测试版AppleIntelligence中发现重大缺陷。站长网2024-08-16 09:01:190000OpenAI或将推出多模态模型GPT-Vision和Gobi,与谷歌Gemini竞争
文章概要:OpenAI正准备推出GPT-4的图像理解,这是一种名为“GPT-Vision”的多模态功能,以使该模型得到更广泛的应用,以与谷歌计划的Gemini多模态AI模型竞争。此功能可以为GPT-4启用新的基于图像的应用程序,例如生成与图像匹配的文本。OpenAI还在开发一种新的AI模型,代号为“Gobi”,该模型从一开始就被设计为多模式,并有可能成为GPT-5。站长网2023-09-20 12:01:010003国产GPTs来了,基于智谱第4代大模型!模型性能均达GPT-4九成以上
国产大模型玩家智谱AI,交出最新成绩单——发布全自研第四代基座大模型GLM-4,且所有更新迭代的能力全量上线。作为国内唯一一个产品线全对标OpenAI的大模型公司,智谱年前攒了波大的:按官方说法,GLM-4性能相比GLM-3提升60%,逼近GPT-4(11月6日最新版本效果)。而同时推出的GLM-4-AllTools,能够完成用户意图理解-复杂指令规划-自由调用GLM生态的多种模型能力。站长网2024-01-16 14:51:270000小米回应无法退定金问题:消费者主动锁单就不再退还
昨晚,备受瞩目的小米SU7正式上市开售,三个版本的新车售价区间定为21.59万元至29.99万元。据官方数据显示,新车销售势头强劲,上市仅4分钟便有大定订单突破万辆,7分钟后更是达到2万辆,而在短短的27分钟内,大定订单数量已突破惊人的5万辆。特别值得一提的是,限量发售的5000台创始版本车型,在预订开启的短短百秒内即被抢购一空,可见其受欢迎程度。站长网2024-04-06 14:20:400000金山办公:上半年研发投入7.17亿元 研发费用率约33%
昨日,金山办公正式发布了2023年半年报。金山办公上半年营业收入21.72亿元,同比增长21.25%;归母净利润5.99亿元,同比增长15.32%;归母扣非净利润5.76亿元,同比增长39.88%,盈利能力持续提升。站长网2023-08-23 12:45:280000