多模态运动语言模型MotionGPT 可将语言指令转换为3D人体运动
站长网2024-01-05 12:02:030阅
MotionGPT是一款令人惊叹的技术创新,它统一了语言和运动,将语言指令转换为引人入胜的3D人体运动。这一模型的设计灵感源于即时学习,通过混合运动语言数据进行预训练,并通过基于提示的问答任务进行微调,使其具备卓越的性能。
项目地址:https://huggingface.co/spaces/OpenMotionLab/MotionGPT
其操作原理类似于将3D动作转换为动作标记,类似于生成单词标记的过程。模型通过将人体动作视为一种特定的语言进行建模训练,实现了运动与文本的无缝结合。而为了处理人体运动,MotionGPT采用了离散向量量化,将3D运动转化为运动令牌,这一过程类似于生成单词令牌的方式。
研究人员在广泛的实验中展示了MotionGPT的卓越性能。模型在多个运动任务上都取得了最先进的成果。这些任务包括由文本驱动的运动生成,即根据文本描述生成相应的人体动作;运动字幕,可能涉及将运动转化为文本描述;运动预测,即预测接下来的运动;以及中间运动,可能涉及生成两个给定运动之间的运动。
MotionGPT的独特之处在于它能够从零散的语言指令中理解并生成引人入胜的人体运动,无论是踢腿还是跳舞,模型都能迅速响应。这种全新的运动语言模型为虚拟现实、电影制作等领域带来了前所未有的可能性。总体而言,MotionGPT不仅是一种技术的突破,更是对人机交互的重大推动,将语言与运动巧妙地融合,开创了全新的应用前景。
0000
评论列表
共(0)条相关推荐
Evernote 已裁掉大部分美国员工 并将把大部分业务转移到欧洲
笔记应用公司Evernote昨天宣布解雇了大部分位于美国和智利的员工。现在,意大利母公司BendingSpoons将大部分Evernote的业务转移到欧洲。图片来自Evernote该公司表示,此举旨在「提高运营效率,并充分利用BendingSpoons在欧洲非常强大的雇主品牌」。站长网2023-07-10 15:59:470000迈向「低价」,小红书要大胆点
今年双十一的提前抢跑,让布局电商业务的互联网平台纷纷使出了浑身解数,流量新贵小红书也不例外。整个被拉长的购物周期,小红书也拿出了多位明星化身买手进行首播的噱头,来吸引更多用户入场。吴建豪、刘维、朱丹、李湘等明星都打出了“重磅首播”的宣传词,来为这届小红书双十一摇旗呐喊。0000沃顿商学院:ChatGPT的创意能力,比MBA学生更好
9月13日,全球最大商学院之一宾夕法尼亚大学-沃顿商学院,在官网公布了一项研究,ChatGPT(GPT-4)在创意想法测试中,其能力超过了精英MBA学生。该测试是让ChatGPT和MBA学生,为大学生市场设计出零售价为50美元或以下,200个产品创意。衡量创意的标准是,看谁的创意能让商品卖的更多。站长网2023-09-15 09:22:580001YouTube 正在全力发展人工智能:为创作者推出一系列 AI 驱动的新工具
站长之家(ChinaZ.com)9月22日消息:在YouTube平台上,将有更多内容部分采用生成式人工智能来创作。该视频平台在周四的年度YouTube创作活动上宣布了几个新的AI工具支持创作者。其中,今年晚些时候或明年推出的功能包括:AI生成的照片和视频背景、AI视频主题建议和音乐搜索等。站长网2023-09-22 09:37:280000互联网314事件:不少站长因疑似聚合支付0day漏洞痛失百万
近日,一起严重的网络安全事件引起了广泛关注。在一个程序员售后群中,有人分享了一张关于“易支付SQL注入测试”的截图。截图显示,某个网站使用的支付接口被SQL注入攻击,导致订单回调被篡改,从而使支付成功。站长网2024-03-15 14:29:180004