英伟达发布 CALM 人工智能模型:能够生成 500 亿个身体动作
站长网2023-08-11 15:04:180阅
现在有了英伟达的新型 AI 语言模型 CALM(Conditional Adversarial Latent Models),理论上你可以借助它来创建自己的视频游戏角色。CALM 是一种用于训练可控虚拟角色(也就是视频游戏角色)的 AI 语言模型。
英伟达与以色列理工学院、巴伊兰大学和西蒙弗雷泽大学合作撰写了一篇详细介绍该模型结构和训练方法的论文。
CALM 在一个模拟现实中进行了连续 10 年的训练,相当于真实世界时间中的 10 天。经过这次训练,该模型能够生成 500 亿个身体动作。由 CALM 生成的角色是一个带有白纹样式的战士,他能够模仿并展示与行走、奔跑和挥剑等本能人类动作相关联的动作。
我们提出了条件对抗潜在模型 (CALM),这种方法可以为用户可控制互动虚拟角色生成多样化且直接性强的行为。通过使用仿真学习,CALM 学习到一种捕捉人类运动复杂性和多样性特征,并使得对角色运动具有直接控制能力的表示形式。该方法同时学习控制策略和运动编码器,后者可以在不仅仅是复制的情况下重构给定运动的关键特征。结果表明,CALM 学习到了一种语义化的运动表示形式,使得对生成的动作具有控制能力,并且可以进行高级任务训练时进行风格调节。一旦训练完成,角色就可以通过直观易用的界面来操控,类似于视频游戏中常见的方式。
你可以将 CALM 代码应用到自己的工作中来创建自己的视频游戏角色或类似 AI 模型。你可以在 GitHub 上找到相关代码。
GitHub:https://github.com/NVlabs/CALM
0000
评论列表
共(0)条相关推荐
小红书线下2.0:不止一个大众点评
与线下的强相关性是小红书社区内容的特点之一,也是小红书实现增长的其中一个能量来源。基于此,举办与线上有映照关系、且最终能反哺线上的线下活动,成为小红书做社区运营时一个越来越习惯的动作,且越来越有手感。站长网2024-03-06 15:49:290000InternVL:60亿参数视觉语言基础模型填补多模态AGI的差距
划重点:多模态AGI的关键突破:InternVL模型填补了视觉和视觉语言基础模型在多模态AGI系统中的发展差距。创新的规模和对齐策略:InternVL通过将视觉基础模型扩展到60亿参数,实现了对LLM的更全面、有效的整合。性能卓越的多样性:在32个通用视觉语言基准测试中,InternVL在图像分类、文本检索、图像字幕等任务上优于现有方法,展现了其卓越的视觉能力。站长网2023-12-28 18:02:490000Together AI发布RedPajama v2:包内30万亿token数据集,用于训练大型语言模型
划重点:📌高质量数据对于像Llama、Mistral、Falcon、MPT和RedPajama等最先进的开放式LLM的成功至关重要。📌Together.ai的研究人员发布了RedPajama-1T,这是一个5TB的数据集,拥有1万亿高质量英语token,而RedPajama-V2则是一个30万亿token的在线数据集。站长网2023-11-06 10:26:290000AI绘图模型不会写字的难题,被阿里AnyText破解了
能准确写汉字的AI绘图工具,终于登场了!包括中文在内一共支持四种语言,而且还能文字的位置还能任意指定。从此,人们终于可以和AI绘图模型的“鬼画符”说再见了。这款名为AnyText的绘图工具来自阿里巴巴,可以按照指定位置精准地向图中加入文字。此前的绘图模型普遍无法准确地向图中添加文字,即便有也很难支持像中文这样结构复杂的文字。0000专为Stable Diffusion 1.5设计!IP Composition Adapter模型可模仿图片构图
要点:1.IPCompositionAdapter是为StableDiffusion1.5设计的适配器,用于将图像的一般构图注入模型,大部分忽略风格和内容。2.SDXL变种正在开发中,用户可以在网站上关注更新。3.Controlnet更为刚性,构图适配器允许更灵活的控制。站长网2024-03-18 15:00:550000