微软推EgoGen:创新性3D数据合成模型 可生成丰富多模态数据
划重点:
1. 🚀 EgoGen是微软与苏黎世联邦理工学院合作推出的创新3D数据合成模型,解决第一人称视角训练数据生成的难题。
2. 🌟 该模型采用双阶段强化学习方案,通过高效的自我感知视觉代理和“注意”奖励,优化生成模型,使虚拟人物更自然、逼真地感知环境。
3. 📊 经过综合评估,EgoGen生成的高质量合成数据显著提升了在头戴式摄像头建图与定位、摄像头跟踪以及第一人称视角恢复人体网格等任务上的算法性能。
站长之家(ChinaZ.com) 2月23日 消息:微软近期推出的EgoGen引起了广泛关注,这是一项创新的3D数据合成模型,旨在应对第一人称视角训练数据生成中的各种挑战。随着AR、VR等设备的广泛应用,第一人称应用越发增多,但相关研发面临着图像模糊、视觉混乱、遮挡等问题,给视觉模型的训练带来了重大挑战。
为了解决这一问题,微软与苏黎世联邦理工学院的研究人员共同推出了EgoGen。该模型不仅具备高效的数据生成流程,而且适用于多个自我中心感知任务,例如能够生成用于恢复自我中心视角下人体网格的数据。

EgoGen的创新之处在于采用了双阶段强化学习方案来训练生成模型。在第一阶段,研究人员使用生成模型训练虚拟人物的行为,将身体运动和感知过程巧妙结合。关键点在于使虚拟人能够通过自我感知的视觉输入看到周围的环境,并通过学习控制一组避免碰撞的运动基元的策略来做出反应,进而合成多样化的人类动作。
为了提高训练的稳定性,EgoGen采用了高效的自我感知视觉代理和“注意”奖励。这一奖励机制在强化学习优化阶段发挥关键作用,通过引导奖励函数,使虚拟人物的运动更加自然和逼真。具体而言,当虚拟人物朝着期望的方向观察时,将获得“注意”奖励的正向反馈,鼓励其在感知任务中更加专注和准确。
经过强化学习优化,研究人员成功改进了生成模型,使虚拟人物能够以最佳方式感知环境、规避障碍并达到目的地。这一过程中,“注意”奖励的实现方式根据具体情况进行调整,确保虚拟人物的注意力与任务目标保持一致。
为了验证EgoGen方法的有效性,研究人员在头戴式摄像头建图与定位、摄像头跟踪以及第一人称视角恢复人体网格等三个第一人称感知任务上进行了综合评估。通过使用EgoGen生成的高质量合成数据,并提供精确的地面真实标注,已有算法在这些任务上的性能得到了显著增强。
EgoGen的推出标志着在解决第一人称视角训练数据生成难题方面迈出了重要一步,为AR、VR等领域的发展提供了有力支持。未来随着该模型的开源,相信将有更多的开发者参与其中,共同推动该领域的发展。
产品特色和亮点包括:
多模态数据生成: EgoGen能够生成丰富的多模态数据,包括逼真的RGB图像、带有模拟动态模糊的RGB图像、深度图、表面法线、分割蒙版以及在头戴设备广泛使用的鱼眼相机的世界位置等。
摄像机仿真: 该系统模拟了头戴设备上的摄像机配置,包括摄像机传感器的位置和角度。用户可以从摄像机佩戴者的视角进行渲染。
准确标注: EgoGen提供准确的注释,有助于训练深度学习模型。这对于主观感知任务中的监督学习至关重要。
可扩展性: 产品具备可扩展性,使其能够适应不同的主观感知任务和场景,提供了更灵活的数据生成解决方案。
论文地址:https://arxiv.org/abs/2401.08739
项目入口:https://top.aibase.com/tool/egogen
人像绝了!张颂文晒小米14 Pro自拍照:直言国产手机质感很好
快科技1月13日消息,小米代言人、知名演员张颂文日前晒出了小米14Pro钛金属版的自拍照。他在微博表示:北京雁栖湖国际会议中心,用我的手机拍的。”画面中,张颂文人像清晰立体,背景虚化柔和。有网友表示手机效果很好,张颂文回应道:现在国产手机确实质感很好。”据了解,今年4月,小米宣布张颂文担任小米影像探索家,此后,他经常在社交平台分享他同各种小米手机拍摄的照片。00002024年私域运营8大趋势!
2024年来了,新的一年私域要怎么做?还有哪些红利场景值得品牌企业重头投入?服务商竞争在2024年会发生什么变化?接下来品牌需要怎样的服务商?服务商还有哪些风险需要规避?针对以上2024年的私域运营趋势,我们在过去一段时间里,持续深聊了几位行业专家,并将他们的答案汇总在一起给你参考,希望对你有帮助,如下,enjoy:趋势一公域获客链路变通畅最好的方式是买广告(小裂变创始人张东晴)站长网2024-02-17 10:08:210000研究显示:生成式AI将影响美国90%的工作
划重点:-🔄**工作变革:**研究指出,生成式人工智能(genAI)将影响美国90%的工作,标志着劳动力和经济动态的显著变化。-💼**经济影响:**预计genAI的部署将导致一半的工作发生显著变化,其中大约9%的工人可能会受到影响。-🔄**技能更新:**随着genAI的广泛应用,不仅仅是手动和例行的知识工作,即将受到影响的还包括更高层次的知识工作。0001雷军:小米汽车坚持正向开发 重新定义汽车工业技术栈
小米集团创始人、董事长雷军在个人微博发表长文,谈及小米汽车背后的故事。他表示,距离小米官宣造车已经过去了1000天,面对外界的质疑和疑问,他强调了正向开发的重要性,并表示小米汽车将重新定义汽车工业的技术栈。雷军指出,攒一辆车并非难事,但小米汽车团队的目标不仅仅是制造一辆车。在小米汽车团队组建之初,他们花了三天三夜的时间讨论一个问题:加入小米,你想造一辆什么样的车?站长网2023-12-25 17:46:100000Sam Altman发布2025年技术愿景,你想OpenAI怎么做?
SamAltman发布了新的一年技术愿景,并在社交平台上征求网友的意见,希望OpenAI发布哪些技术同时优化哪些功能。用户对这个非常感兴趣,评论已经超过8300,浏览量破270万,算是Sam今年最高的推文之一了,比前几天的连续12天直播热闹很多。对于用户的反馈,Sam回复也非常积极,并且还肯定了一些意见非常不错,基本上已经安排上很快就会实现。0000