鹅厂机器狗抢起真狗「饭碗」!会撒欢儿做游戏,遛人也贼6
让机器狗学完真狗子的运动数据,真有二哈那感觉了!
它轻松跨个栏,后面“主人”差点没跟上:
钻个“狗洞”倒是轻车熟路:
还能两只狗一起撒欢儿,它追、它逃……
这就是鹅厂机器狗的最新进展。
利用预训练模型喂给机器狗真狗子的运动数据、并通过强化学习,机器狗Max不仅在行为上更灵动,而且还能根据已经掌握的技能“举一反三”,去适应更加复杂的环境。
总结来说,就是里里外外都“更狗”了一些。
有策略地追逐撒欢儿
这次机器狗学习的新技能里,最强的一项还是玩游戏。
机器狗不仅能遵守规则,还能自己想出策略赢比赛,可能比真狗子还要聪明些。
具体来看,这是一个障碍追逐比赛,受到“World Chase Tag”启发,规则如下:
研究人员设置了不同游戏难度,最简单的就是空旷场地:
玩游戏过程里,机器狗很明显是有策略的。
比如,一般等到躲避者离棋旗子较远时,追击者才会发起猛攻,把它逼到死角,游戏结束。
如果追击者发现躲避者离旗子很近,自己根本没机会追上它时,它会先放弃追逐,等待下一个旗子出现:
有障碍物干扰也没关系,俩狗子一样玩得很6:
而能够有如此表现,并不是机器狗从一开始就拿这个游戏训练。
它其实是基于自己已经学到的一些动作、知识和技能,来应对这个游戏场景。
具体怎么实现?往下看。
学了真·狗的数据
研究一共分为三个阶段。
学习动物运动姿态
将运动姿态和外界感知联系起来
附加网络获取和复杂任务有关信息
第一阶段,是通过游戏中常用的动作捕捉系统,通过收集真狗的姿态数据,包括走、跑、跳、站立等动作,在仿真器中构建一个模仿学习任务。
然后将这些数据中的信息抽象并压缩到深度神经网络模型中,使其在涵盖运动姿态信息的同时,还具有一定可解释性。
腾讯RoboticsX机器人实验室和腾讯游戏合作,用游戏技术提高了仿真引擎的准确性和高效性,同时游戏制作和研发过程中积累了多元的动捕素材。
这些技术以及数据对基于物理仿真的智能体训练以及真实世界机器人策略部署也起到了一定的辅助作用。
在模仿学习的过程中,神经网络仅接受机器狗的本体感知信息作为输入,例如机器人身上电机的状态等。
再下一步,模型引入周边环境的感知数据,例如通过其他传感器“看到”的脚下的障碍物。
第二阶段,通过额外的网络参数,将第一阶段掌握的动物姿态和外界感知联系在一起。
这样机器狗就能通过已经学会的动作,来应对外界环境。
当机器人能够适应多种复杂的环境后,这些将动物姿态与外界感知联系在一起的知识也会被固化下来,存在神经网络结构中。
然后机器狗就能自如上楼梯了。
或者在不连续、不平整地面上奔跑:
然后就到了最后一阶段,让机器狗根据上面学会的技能,去解决实际问题
也就是上面提到的做游戏环节。
据介绍,游戏中机器狗的所有控制策略都是神经网络策略。
在仿真中进行学习并通过zero-shot transfer(零调整迁移),让神经网络模拟人类的推理方式,来识别从未见过的新事物,并把这些知识部署到真实机器人上。
比如在预训练模型中学会了躲避障碍物的知识,那么在游戏里设置障碍,机器狗也能轻松应对。
本次研究新进展由腾讯Robotics X机器人实验室带来。
该实验成立于2018年,目前推出的机器人项目包括机器狗Max一代/二代、机器狗Jamoca、轮式机器人Ollie、自平衡自动驾驶摩托车等。
One More Thing
值得一提的是,之前UC伯克利的学者也将一种“真狗子”的训练方法,用在了机器狗上。
吴恩达开山大弟子Pieter Abbeel等,让机器狗自己在地上打滚一个小时,学会了走路。
而去年腾讯发布机器狗Max二代时,一段小花絮里,这狗会“扑脚”、“撒欢跑”,确实有家里毛孩子那味儿。
(当然,如果想让它成为一只听主人话的狗, 通过指令即可对其发号施令。)
咱就是说,现在机器狗的发展方向,不朝着翻跟头卷,反倒是要和真狗子“抢饭碗”了吗?
周鸿祎炫高考作文押题10中3:展示360AI搜索预测能力
在6月6日的360AI新品发布会上,周鸿祎现场展示了360AI搜索的预测能力,他大胆预测了2024年高考作文题目。而就在今天上午全国高考语文考试结束后,这一预测被证实极具前瞻性。有网友发现,周鸿祎昨日现场预测的10道高考作文题中,竟然精准地押中了本次高考北京卷、全国甲卷和新课标I卷的三道作文题。站长网2024-06-08 05:41:250000亚马逊 AWS 推出由 Bedrock 人工智能模型驱动的 Amazon HealthScribe
亚马逊在近日举行的纽约峰会上宣布推出AmazonHeAlthScribe。据介绍,这是一项符合HIPAA(《健康保险流通与责任法案》)要求的新服务,能够帮助医疗软件供应商使用语音与文本识别和生成式AI技术创建临床应用程序,通过自动生成文档来节省医生时间。站长网2023-08-02 10:08:380000比对口型还牛!InstructAvatar:实现文字生成指定面部的表情和动作
划重点:🔍最新的对话形象生成模型在实现与音频的逼真准确的唇同步方面取得了进展,但在控制和传达形象的细节表情和情感方面仍有不足。🔍InstructAvatar提供了对情感和面部动作进行细粒度控制的文本引导方法,为生成具有情感表达的2D虚拟形象提供了改进的互动性和泛化能力。站长网2024-05-28 19:35:420000Adobe研究人员研发新AI模型LRM:实现从2D样本瞬时生成3D图像
**划重点:**1.💡AdobeResearch和澳大利亚国立大学(ANU)联合宣布,他们研发出首个能够从单一2D图像生成3D图像的人工智能模型。2.💻新算法基于大规模图像样本训练,能够在几秒钟内生成高质量的3D图像,该算法采用了名为LRM(LargeReconstructionModel)的高度可扩展神经网络,包含一百万数据集和五亿参数。站长网2023-11-14 10:52:330000苹果上架iPhone 14/Pro官翻机:起售价不到5000元
快科技5月25日消息,苹果每年在推出新iPhone之后,都会将前一代的Pro系列直接下架,无法通过官网购买。不过苹果最新在美国官网重新上架了iPhone14、iPhone14Pro和iPhone14ProMax三款机型,都是官方翻新机。美国苹果线上商城苹果iPhone14的起售价为619美元(约合4488元人民币),比全新价699美元便宜80美元,最高容量可以达到256GB。0000