英伟达值14万亿吗?
随着AR、VR等设备的广泛应用,第一人称的应用开始增多。但在研发方面面临不同的挑战,例如,图像模糊、视觉混乱、遮挡更严重等,给视觉模型的训练带来重大挑战。
一方面,人工标注真实第一视角数据集,来培训深度学习模型的成本和难度都很高。另一方面,以往用于第三人称视角的虚拟渲染数据,无法很好地模拟第一视角下的真实人体运动与环境交互过程。
为了解决这些难题,微软和苏黎世联邦理工学院的研究人员推出了EgoGen,这是一个用于生成第一视角训练数据的模型。
EgoGen不仅具有高效的数据生成流程,还能够适用于多个自我中心感知任务,例如,生成的数据可以用于恢复自我中心视角下的人体网格。
论文地址:https://arxiv.org/abs/2401.08739
即将开源地址:https://github.com/ligengen/EgoGen
EgoGen使用了一种创新的人体运动合成模型来合成高数据。该模型通过直接利用虚拟人的自我中心视觉输入,来感知周围3D环境。
与先前的方法相比,EgoGen的模型消除了对预定义全局路径的需求,并且可以直接应用于动态环境。
生成模型训练
EgoGen模型的第一阶段,研究人员使用了一种生成模型来训练虚拟人物的行为,将身体运动和感知过程无缝地结合起来。
身体运动与感知的关键点是使虚拟人能够通过自我感知的视觉输入看到他们的环境,并通过学习控制一组避免碰撞的运动基元的策略来做出相应的反应,这些基元可以组合以合成长期的多样化人类动作。
通常我们生成的运动基元模型具有无界和高维的潜在动作空间,直接通过渲染的自我感知图像进行策略训练是很不稳定的。
所以,EgoGen使用了一种高效的自我感知视觉代理的双阶段强化学习方案,无缝地将自我感知视觉线索和身体运动相结合,同时使用了“注意”奖励来激励自我感知行为。
强化学习优化
研究人员使用了强化学习优化方法对生成模型进行性能优化,可以让虚拟人物能够以最佳方式感知环境、规避障碍并达到目的地。
主要通过奖励函数的引导,使虚拟人物的运动变得更加自然和逼真。具体来说,当虚拟人物在生成过程中朝着期望的方向观察时,将受到"注意"奖励的正向反馈。
这意味着如果虚拟人物能够集中注意力并关注与任务相关的对象或区域,将获得额外的奖励信号。这鼓励虚拟人物在感知任务中更加专注和准确。
"注意"奖励的实现方式可以根据具体情况进行调整。例如,在训练过程中,可以通过监测虚拟人物的视觉输入和目标方向之间的一致性来计算奖励值。
如果虚拟人物的注意力与任务目标的位置或运动方向相一致,奖励值将增加;反之,如果虚拟人物的注意力偏离了任务目标,奖励值将减少或为负值。
通过不断优化生成模型,并利用这些奖励信号进行反馈,逐步改进了虚拟人物的行为,使其能够准确地感知和适应复杂的环境。
为了验证EgoGen方法的有效性,研究人员在三个第一人称的感知任务上进行了综合评估:头戴式摄像头的建图和定位、摄像头跟踪以及从第一视角恢复人体网格。
通过使用EgoGen生成的高质量合成数据,并提供精确的地面真实标注,现有的最先进算法在这些任务上的性能全部得到了大幅度增强。
本文素材来源EgoGen论文,如有侵权请联系删除
谷歌Chrome用户可以在桌面浏览器上访问微软的Bing AI聊天
GoogleChrome用户现在可以在桌面浏览器上访问微软的BingAI聊天和AI驱动的搜索结果。几个月来,只有登录微软账户的用户才能通过Bing应用或微软Edge浏览器访问AI聊天界面。现在,你可以在接受服务条款和确认AI聊天机器人的隐私声明后,在除Edge之外的其他浏览器上与BingAI聊天。站长网2023-07-25 15:51:430000草案显示美国准备全力以赴地对快速发展的 AI 技术实施国家规则
站长之家(ChinaZ.com)10月28日消息:根据POLITICO获得的一份行政命令草案,美国总统乔·拜登即将动用多个联邦机构,监控人工智能的风险,开发新的技术应用,同时努力保护劳动者。预计该命令将在下周一发布,它将简化高技能移民流程,创建多个新的政府机构和任务组,为联邦政府几乎接触到生活的每个方面使用更多的AI铺平道路,包括健康、教育、贸易和住房等。站长网2023-10-28 13:48:290000这群人,决定用直播带货复活天涯论坛
4月25日,用户发现,知名BBS论坛天涯社区网页、客户端均无法打开,随后,该话题登上微博热搜,引起网友热议。天涯论坛执行总编宋铮在社交平台透露,天涯社区没有死,只是全身「瘫痪」,数据中心欠费、服务器被停。因为官司缠身,域名也被法院冻结了。天涯「瘫痪」半个月后,有网友爆出一则消息:站长网2023-05-18 09:14:150000BioMap百图生科 AIGP 蛋白设计平台开启内测
百图生科的AIGP蛋白设计平台发布了首批内测用户招募信息,限量50家,内测注册成功用户将获得免费的算力币,并可以邀请好友试用并获得更多算力币。该平台是基于百图生科的生命科学FoundationModel-xTrimo推出的生成式蛋白设计平台,可以支持多种类蛋白质的生成和优化。AIGP蛋白设计平台无需本地部署,可在线即点即用,用户的数据也会受到严格的加密和保护。站长网2023-09-11 14:04:360000AI算力70年增长6.8亿倍,3个历史阶段见证AI技术指数级爆发
【新智元导读】一张图揭示了AI算力70多年发展了6.7亿倍,未来AI各方面能力将全面超越人类,而真正令人期待的是,AI行业才刚刚进入爆发前的萌芽期。电子计算机于上世纪40年代诞生,而在计算机出现后的10年内,人类历史上的第一个AI应用就出现了。70多年过去了,AI模型现在不仅能写诗,还能根据文本提示生成图像,甚至是帮助人类发现未知的蛋白质结构。站长网2023-09-25 15:33:480000