针对多无人机对抗任务仿真在中央处理器(central processing unit, CPU)上的推演时间随无人机数量呈平方增长的问题,设计并构建了一个图形处理器(graphics processing unit, GPU)并行加速的轻量级多无人机对抗仿真环境。相较于已有仅限单无人机任务、仅对多无人机动力学推演并行化的仿真框架,在面向多无人机对抗问题的基础上,进一步开展了对每个环境中无人机相对位姿和毁伤关系的并行化计算。针对传统基础空战机动只在平飞状态下有良好定义的局限性,设计了改进的全姿态可解释的基础空战机动。仿真环境所包含的多种规模可扩展的多无人机对抗任务,可为各类任务实现启发式基线策略,并可为一对一对抗任务实现基于近端策略优化算法的基线策略。与在8核16线程上的多线程仿真相比,所提平台可将采样速度提升2~3个数量级。在CPU与GPU 并行环境下的强化学习训练结果表明,GPU 加速的仿真环境能将训练时间缩短至1/50,同时不会因为采样轨迹碎片化显著降低采样效率。所提并行加速的多无人机对抗仿真环境能显著提升采样与训练速度,有助于加快该领域的研究进程。





