创新性3D数据合成模型,微软推出EgoGen
随着AR、VR等设备的广泛应用,第一人称的应用开始增多。但在研发方面面临不同的挑战,例如,图像模糊、视觉混乱、遮挡更严重等,给视觉模型的训练带来重大挑战。
一方面,人工标注真实第一视角数据集,来培训深度学习模型的成本和难度都很高。另一方面,以往用于第三人称视角的虚拟渲染数据,无法很好地模拟第一视角下的真实人体运动与环境交互过程。
为了解决这些难题,微软和苏黎世联邦理工学院的研究人员推出了EgoGen,这是一个用于生成第一视角训练数据的模型。
EgoGen不仅具有高效的数据生成流程,还能够适用于多个自我中心感知任务,例如,生成的数据可以用于恢复自我中心视角下的人体网格。
论文地址:https://arxiv.org/abs/2401.08739
即将开源地址:https://github.com/ligengen/EgoGen
EgoGen使用了一种创新的人体运动合成模型来合成高数据。该模型通过直接利用虚拟人的自我中心视觉输入,来感知周围3D环境。
与先前的方法相比,EgoGen的模型消除了对预定义全局路径的需求,并且可以直接应用于动态环境。
生成模型训练
EgoGen模型的第一阶段,研究人员使用了一种生成模型来训练虚拟人物的行为,将身体运动和感知过程无缝地结合起来。
身体运动与感知的关键点是使虚拟人能够通过自我感知的视觉输入看到他们的环境,并通过学习控制一组避免碰撞的运动基元的策略来做出相应的反应,这些基元可以组合以合成长期的多样化人类动作。
通常我们生成的运动基元模型具有无界和高维的潜在动作空间,直接通过渲染的自我感知图像进行策略训练是很不稳定的。
所以,EgoGen使用了一种高效的自我感知视觉代理的双阶段强化学习方案,无缝地将自我感知视觉线索和身体运动相结合,同时使用了“注意”奖励来激励自我感知行为。
强化学习优化
研究人员使用了强化学习优化方法对生成模型进行性能优化,可以让虚拟人物能够以最佳方式感知环境、规避障碍并达到目的地。
主要通过奖励函数的引导,使虚拟人物的运动变得更加自然和逼真。具体来说,当虚拟人物在生成过程中朝着期望的方向观察时,将受到"注意"奖励的正向反馈。
这意味着如果虚拟人物能够集中注意力并关注与任务相关的对象或区域,将获得额外的奖励信号。这鼓励虚拟人物在感知任务中更加专注和准确。
"注意"奖励的实现方式可以根据具体情况进行调整。例如,在训练过程中,可以通过监测虚拟人物的视觉输入和目标方向之间的一致性来计算奖励值。
如果虚拟人物的注意力与任务目标的位置或运动方向相一致,奖励值将增加;反之,如果虚拟人物的注意力偏离了任务目标,奖励值将减少或为负值。
通过不断优化生成模型,并利用这些奖励信号进行反馈,逐步改进了虚拟人物的行为,使其能够准确地感知和适应复杂的环境。
为了验证EgoGen方法的有效性,研究人员在三个第一人称的感知任务上进行了综合评估:头戴式摄像头的建图和定位、摄像头跟踪以及从第一视角恢复人体网格。
通过使用EgoGen生成的高质量合成数据,并提供精确的地面真实标注,现有的最先进算法在这些任务上的性能全部得到了大幅度增强。
抖音电商押注货架,发力图文,谁能继续赚钱?
GMV增长超过80%,抖音电商的第三年,仍在狂飙。平台方从未公开过总交易额数据,不过纵向来看,2022年5月,抖音电商GMV同比增长220%,到2023年5月,这个数据变成80%。增幅仍在,且领先于其他电商平台,增速却在逐步放缓。这与互联网流量红利见顶、降本增效的大环境息息相关,也是一个新兴产品从红利期走向成熟期的必经之路,平台需要寻找新的增长支点,商家和达人也需要更多确定性的增长机会。站长网2023-05-19 14:50:410001麦当劳决定炒掉AI员工,用AI点餐这件事不靠谱
从游戏公司的画师到电销公司的客服,被AI影响到工作的人在2023年可谓是一茬接着一茬,甚至“第一批因AI而失业的人出现”更是成为了去年部分媒体最有兴趣的话题。事实上,AI技术的快速发展确实已经开始对人类社会造成影响,但过高估计当下AI的能力也大可不必,因为已经有第一批AI员工开始下岗了。日前,麦当劳方面宣布AI点餐员项目即将终止,这一套与IBM合作的自动点餐系统在测试了3年之后以失败告终。站长网2024-07-17 13:32:360003为先锋而生!荣耀手机正式宣布与保时捷设计合作
荣耀今天正式宣布与保时捷设计合作,发布了官方海报,标语为“为先锋而生”。荣耀表示,当其创新科技与保时捷经典设计碰撞,将共同书写新传奇,创造新经典。据悉,保时捷设计将首先应用于荣耀Magic6手机上。荣耀Magic6已经获得3C认证,型号为BVL-AN16,产品名称为卫星移动终端(5G),确认支持卫星通讯。0002单月涨粉近400万,这个赛道重回抖音C位
4月抖音涨粉榜已出,我们一起来看榜:从整体涨粉走势来看,4月和3月相比稍有回落,并未出现涨粉量在500W以上的账号,且位列TOP1的也并非常规创作者,而是近日人气高涨的“爽文大男主”雷军——凭借在各大社交媒体上的超高活跃度和与网友之间的积极互动,他不仅一跃成为互联网上的顶流,更是让小米SU7有了极其亮眼的销售成绩。站长网2024-05-15 18:19:180000苹果已收购Darwin AI 官方回应:常规投资行为
苹果公司今年早些时候在AI领域再下一城,成功收购了DarwinAI公司,进一步增强了其在人工智能领域的实力。DarwinAI是一家总部位于加拿大安大略省Waterloo的初创公司,自2017年成立以来,一直专注于两大核心技术的研发:一是利用AI技术检查制造过程中的零部件,二是通过机器学习构建更小、更高效的AI系统。站长网2024-03-15 08:41:450000