刺激，无人机竞速超越顶级人类玩家，强化学习再登Nature封面

站长网2023-09-02 09:38:210阅

最近，在一场无人机比赛中，一架自主控制的无人机战胜了顶级人类玩家。

这架自主控制无人机是由来自苏黎世大学的研究团队设计研发的 Swift 系统，研究成果登上了最新一期的《Nature》杂志封面。

研究内容:https://www.nature.com/articles/s41586-023-06419-4

在这场无人机比赛中，人类操纵者通过机载摄像机操纵无人机通过3D 赛道，这是为了让操纵者从无人机的视角观察环境。自主无人机要达到人类控制无人机的水平是非常具有挑战性的，因为无人机需要仅通过机载传感器估计其在赛道中的速度和位置。

而 Swift 战胜的是世界冠军级人类玩家，他们分别是:2019年无人机竞速联盟世界冠军 Alex Vanover、两届 MultiGP 国际公开赛冠军 Thomas Bitmatta 和三届瑞士全国冠军 Marvin Schaepper。

下图1a 是这次比赛的赛道，Swift 不仅赢得了与人类冠军的比赛，还创造了最快的比赛纪录。这项工作是移动机器人和机器智能领域的一个里程碑。

图1

下面我们就来看一下自主无人机 Swift 的技术方法。

Swift 技术介绍

Swift 是一个仅使用机载传感器和计算完成自主控制的四旋翼飞行器，由两个关键模块组成:

感知系统，将高维的视觉和惯性信息转换成低维表征;

控制策略，摄取感知系统产生的低维表征并产生控制命令。

其中，控制策略由一个前馈神经网络来表征，并使用无模型 on-policy 深度强化学习（RL）进行训练。

由于模拟与现实世界在传感和动力学方面存在差异，仅在模拟中优化策略会导致无人机的现实性能较差，因此研究团队利用物理系统收集的数据来估计非参数经验噪声模型（non-parametric empirical noise model）。实验表明，这些经验噪声模型有助于将控制策略从模拟成功转移到现实。

具体来说，Swift 将机载传感器的读数映射成控制命令，这一映射包括两部分:（1）观察策略，将高维的视觉和惯性信息提炼成特定于任务的低维编码;(2) 控制策略，将编码转换成无人机命令。Swift 系统整体概览如下图2所示:

图2

如图1所示场景，Swift 的观察策略需要运行视觉 - 惯性估计器和门检测器。其中，门检测器是一个卷积神经网络，用于检测机载图像中的赛车门，然后使用检测到的门来估计无人机在赛道上的全局位置和飞行方向。这是使用相机后方交会算法（camera-resectioning algorithm），并结合赛道地图来完成的。最后，Swift 用卡尔曼滤波(Kalman filter)将全局姿态估计(从门检测器获得)与视觉 - 惯性估计结合起来，从而更准确地表征机器人的状态。

控制策略（用一个两层感知器表征），负责将卡尔曼滤波(Kalman filter)的输出映射成无人机控制命令。控制策略在模拟中使用无模型 on-policy 深度强化学习(RL)进行训练。在训练期间，该策略会考虑相机视野内下一个竞赛门的信息，将奖励最大化，以提高姿态估计的准确性。

实验及结果

为了评估 Swift 的性能，该研究进行了一系列的比赛实验，并与轨迹规划和模型预测控制（MPC）进行了比较。

如下图3b 所示，在与 A. Vanover 的9场比赛中，Swift 赢了5场;在与 T. Bitmatta 的7场比赛中，Swift 赢了4场;在与 M. Schaepper 的9场比赛中，Swift 赢了6场。在 Swift 记录的10次失利中，40% 是因为与对手相撞，40% 是因为与竞赛门相撞，20% 是因为比人类控制的无人机慢。总体而言，在与人类控制无人机进行的比赛中，Swift 获胜次数最多，并且它还创造了最快的比赛纪录，比人类控制无人机（A. Vanover）的最佳时间快了半秒。

图3

为了对 Swift 的性能进行更细致的分析，该研究比较了 Swift 和人类控制无人机的最快单圈飞行速度，结果如下图4和表1所示。

图4

表1

虽然从整体上看，Swift 比所有人类控制无人机都要快，但它在赛道的每个赛段上的速度并不快，如表1所示。

研究团队仔细分析发现:在起飞时，Swift 的反应时间较短，平均比人类飞行员早120毫秒起飞;Swift 的加速也更快，进入第一个竞赛门时速度更高。在急转弯时，如图4cd 所示，Swift 的动作更加紧凑。

研究团队还提出一种假设，Swift 在比人类操控者更长的时间尺度上优化轨迹。众所周知，无模型 RL 可以通过价值函数优化长期奖励（long-term reward）。相反，人类操控者规划运动的时间尺度较短，最多只能预测未来一个竞赛门。

刺激 无人机竞速超越顶级人类玩家强化学习再登Nature封面

0000

评论列表

共(0)条

相关推荐

「点点」浮出水面，小红书AI搜索有了新进展
小红书围绕AI搜索进行的探索一直在进行。接棒AI对话助手达芬奇和一度在小红书站内灰度测试的搜搜薯，定位生活搜索助手的「点点」在上线四个月后进入大众视线，成为观察小红书探索思路的又一个窗口。
站长网站长资讯2024-12-25 14:12:21
0000
站长资讯
美图AI视觉大模型MiracleVision奇想智能正式上线
1月5日，美图公司自研AI视觉大模型MiracleVision（奇想智能）正式上线。广大用户可在MiracleVision(奇想智能)官网(miraclevision.com)和美图秀秀、WHEE等美图旗下产品中率先体验。用户可前往美图秀秀体验文生图、图生图等功能，前往WHEE体验文生图、图生图、模型训练、局部修改、画面扩展等功能。
站长网2024-01-05 11:42:44
0000
站长资讯
打低价，弱达播，抖音电商逼近拼多多？
抖音再一次深入拼多多的低价腹地。据“Tech星球”报道，抖音电商再次修改《抖音商城低价秒杀频道招商规则》，核心变化包括:合并“爆款秒杀”和“日常秒杀”入口、调整提报价、延长价格追溯期等。同时，抖音商城页面上线了比价频道“找好价”。通过该功能，用户可在商城内找到同款商品的最低价，入口与抖音电商现阶段重点业务“小时达”并列。今年以来，抖音电商在低价赛道动作频频，颇有效仿拼多多的苗头。
站长网2024-07-22 17:41:55
0000
站长资讯
Animate Anyone引发人们对虚假视频泛滥的担忧
要点:由阿里巴巴智能计算研究所研发的“AnimateAnyone”是一种新的生成视频技术，能够将静态图像转换为高度逼真的动态深度伪造视频。该技术改进了之前的图像到视频系统，解决了以往存在的幻觉问题，使生成的视频更为逼真，尽管仍存在一些问题，尤其是在处理眼睛和手部动作方面。
站长网2023-12-05 10:27:31
0000
站长资讯
苹果AI来了，压力给到华米OV
和其他手机厂商对比，苹果AI含金量如何?苹果AI终于来了，华为、小米、OPPO、vivo这些手机厂商反倒没那么紧张了。
站长网2024-06-13 11:21:43
0000