商汤科技提出Story-to-Motion:从长文本生成人体运动轨迹
要点:
人工智能在动画、游戏和电影领域的应用中,从长篇文本中生成自然人类运动是一个复杂而困难的任务。研究团队提出了一种新的方法,通过三个主要组件,即文本驱动的运动调度、文本驱动的运动检索系统和渐进式掩蔽变换器,成功解决了这一挑战。
提出的方法通过引入轨迹和语义,能够从长篇文本中生成全面的运动,从而解决了“故事到运动”问题。特别地,文本驱动的运动匹配为准确、可定制的运动合成提供了新方法。在多个子任务上的实验证明,该方法在轨迹跟踪、时间动作组合和运动混合方面优于现有技术。
该系统代表了从文本叙述中合成人类运动的重大进展,将在动画、游戏和电影行业产生深远的影响。它为“故事到运动”任务提供了全面解决方案,具有改变行业格局的潜力。
人工智能正逐渐渗透到各行各业,其中一项重要的进展是通过长篇文本生成自然人类运动,这在动画、游戏和电影等领域具有巨大潜力。然而,从文本到运动的转化一直是一个巨大挑战,尤其是在处理角色在不同区域移动和执行特定动作时。
尽管过去已经付出了大量努力来研究文本到运动和角色控制,但迄今为止尚未找到合适的解决方案。现有的角色控制方法存在许多限制,无法处理文本描述,而当前的文本到运动方法则需要更多的位置约束,导致生成不稳定的运动。

项目地址:https://story2motion.github.io/
为了应对这些挑战,研究团队提出了一种独特的方法,该方法通过三个关键组件解决了“故事到运动”的问题。首先是文本驱动的运动调度,它利用现代大型语言模型从长篇文本中提取文本、位置和持续时间对,作为文本驱动的运动调度器,确保生成的运动基于故事并包含有关每个动作的位置和长度的详细信息。
其次是文本驱动的运动检索系统,通过将运动匹配和对运动轨迹和语义的约束相结合,创建了一个全面的运动检索系统,确保生成的运动满足预期的语义和位置属性以及文本描述。最后是渐进式掩蔽变换器,它专门设计用于处理过渡运动中的常见伪影,如脚滑动和不寻常的姿势,以提高生成运动的质量,产生更平滑的过渡和更真实的外观。
这一方法经过了在运动混合、时间动作组合和轨迹跟踪等三个子任务上的测试,结果显示在每个领域都优于先前的运动合成技术。
研究人员总结了他们的主要贡献,包括引入轨迹和语义以从长篇文本生成全面的运动,提出了一种新方法——基于文本的运动匹配,以提供准确和可定制的运动合成,并在轨迹跟踪、时间动作组合和运动混合子任务上的实验证明其优于现有技术。
总的来说,这个系统标志着从文本叙述中合成人类运动的一大步前进。它不仅为“故事到运动”任务提供了完整的解决方案,还在动画、游戏和电影等行业中具有革命性的影响。这项研究的成果为人工智能技术在创意产业中的应用开辟了新的可能性,有望为相关领域带来巨大的发展。
“争吵”中开启的双十一:平台与主播对垒,头部主播间正面PK
今年的双十一,群雄逐鹿,谁能问鼎?不同于以往,今年双十一,在各电商平台积极参与的同时,各平台大小主播们也都活跃在这个秋天。面对各个平台主播们的强势竞争,今年各电商平台也不再拘泥于过于复杂的促销玩法,而是纷纷主打最低价。于是2023年的双十一,形成了多足鼎力的局面;激烈的竞争也使得火药味越来越浓。因为就在双十一开启的第一天,一连串热点事件让这个购物节与众不同。新现象一:平台与主播对垒喊话站长网2023-10-26 09:13:160001万元买手机很难吗?中美日韩等1月销量TOP 5:iPhone完爆安卓
快科技4月15日消息,市场调研机构Counterpoint公布了全球2023年1月份,一些国家和地区的手机销量榜单,主要集中前五强,没有意外的是,苹果完全秒杀安卓阵营。先来看中国市场,销量最好的前四名手机都是iPhone,分别是iPhone14、14ProMax、iPhone13和iPhone14Pro,而安卓中入榜的是OPPOReno9。站长网2023-04-15 09:07:440000揭秘MCN机构内容生产流水线
各位村民好,我是村长。很多人十分好奇,一个专业的MCN机构,是如何标准化进行内容流水线式生产的。今天村长就简单和大家拆解一下,当然不一定对,毕竟每家都有差异。但核心想告诉各位两点:其一相比于个人,机构在内容生产上有成熟的团队、方法论和资金。其二当下内容赛道的竞争是很残酷,所以个人想要出圈,好内容永远是核心。01红人招募一般来说,MCN有两种招募方式。站长网2023-08-28 17:50:230000巴菲特:苹果用户对品牌忠诚度极高 出价1万美元也无法撼动放弃 iPhone
沃伦·巴菲特和伯克希尔·哈撒韦公司是苹果公司的忠实粉丝,这已不是什么秘密,上个月,这家企业集团透露,它进一步扩大了其已经持有的大量苹果股票。在周三的一次新的采访中,巴菲特再次歌颂了苹果公司、首席执行官蒂姆·库克和iPhone的忠诚度。站长网2023-04-13 16:41:110000Interactive3D:可直接通过交互操作指导3D模型生成
Interactive3D技术为3D内容的创造和修改提供了一种极其灵活的方法。用户可以直接通过交互操作来指导3D模型的生成,这一过程不仅直观,而且具有高度的创造性。主要特点包括:组件添加与移除:用户可以像搭建乐高一样,通过添加或移除组件来对3D模型进行各种组合,实现个性化的模型构建。变形与拖动操作:支持可变形和刚性拖动等操作,使用户能够以更细致的方式调整和优化模型的每个部分。站长网2024-04-27 17:40:480000