冠军级别的无人机赛车使用深入的强化学习

   日期:2025-06-23     来源:本站    作者:admin    浏览:83    
核心提示:  无人机比赛发生在由外部世界一流的FPV飞行员设计的赛道上。该曲目具有特征性和具有挑战性的操作,例如Split-S(图1A(右上角

  无人机比赛发生在由外部世界一流的FPV飞行员设计的赛道上。该曲目具有特征性和具有挑战性的操作,例如Split-S(图1A(右上角)和4D)。如果他们的车辆仍然能够飞行,即使在撞车事故发生后,飞行员也可以继续赛车。如果两个无人机都崩溃并且无法完成赛道,那么沿着赛道越来越远的无人机将获胜。

  如图3B所示,Swift在9场对阵A. Vanover的9场比赛中有5次赢得比赛,其中4场对阵T. Bitmatta的比赛中有4场比赛,在9场比赛中有6场对阵Schaepper M. Schaepper。在记录的Swift的10次损失中,有40%是由于与对手发生碰撞,40%是因为与门发生碰撞,而20%的损失是由于无人机比人类飞行员慢。总体而言,Swift赢得了大多数比赛对抗每个人的飞行员。斯威夫特还达到了记录最快的比赛时间,比人类飞行员(A. Vanover)的最佳时间领先半秒。

  图4和扩展数据表1D提供了Swift和每个人飞行员飞行的最快圈的分析。尽管SWIFT在全球范围内比所有人类飞行员都要快,​​但在轨道的所有各个段中,它并不快(扩展数据表1)。Swift在开始时始终持续更快,并且在诸如SplitS的狭窄转弯处更快,Swift在人类飞行员之前平均从讲台上起飞的反应时间较低,在人类飞行员之前120毫秒。此外,它可以更快地加速并达到进入第一个门的较高速度(扩展数据表1D,段1)。如图4C所示,急剧转弯,Swift发现了更严格的动作。一个假设是,Swift优化了比人类飞行员更长的时间尺度上的轨迹。众所周知,无模型RL可以通过值函数优化长期奖励38。相反,人类飞行员计划在较短的时间范围内计划他们的动议,直到未来的一个门。39。这是显而易见的,例如,在拆分s中(图4b,d),该飞行员在开始时和末尾的速度更快,但总体上较慢(扩展数据表1D,段3)。同样,人类飞行员将飞机定向比Swift更早面对下一个大门(图4C,D)。我们建议人类飞行员习惯于将即将到来的大门保持观察,而Swift却学会了在依靠其他提示的同时执行一些操作,例如惯性数据和视觉探测器针对周围环境中的功能。总体而言,自动无人机在整个赛道上平均达到了最高的平均速度,发现最短的赛车线并设法使飞机在整个比赛中更接近其致动界限,如平均推力和绘制功率所示(扩展数据表1d)。

  我们还比较了Swift和人类冠军在计时试验中的表现(图3A)。在一次计时赛中,一个飞行员赛车比赛,剩下的圈数剩下了飞行员的酌处权。我们从练习周和种族中积累了时间预审数据,包括训练跑(图3A,有色)和在比赛条件下飞行的圈(图3A,黑色)。对于每个参赛者,我们使用300多圈来计算统计。自主无人机更加一致地推动快速圈时间,表现出较低的平均值和差异。相反,人类飞行员决定是否在训练中和比赛期间和种族中的圈速时间逐渐升高速度,从而产生更高的平均值和差异。适应飞行策略的能力使人飞行员在确定明确的铅,以降低崩溃的风险,以保持较慢的步伐。自主无人机并不意识到其对手,无论如何都会推动最快的预期完成时间,在领先时可能会冒出太多的风险,而在落后40时则可能太少了。

 
打赏
 
更多>同类资讯

推荐图文
推荐资讯
点击排行