摘要:重载六足机器人在野外地形环境移动作业时的决策智能水平亟待提高。 然而,当机器人在尚未形成合理的决策结构层 次时,直接采用其与环境进行交互方式进行常规的强化学习训练,将导致机器人的行为决策过于发散。 因此,本文首先利用一 种符合驾驶员决策逻辑的分步训练神经网络,得到驾驶员的决策经验模型,使机器人快速形成自主决策智能。 此外,为融合人 机决策优势,本文基于合作博弈理论,提出一种消除人机协同决策指令冲突的方法。 搭建面向重载六足机器人人机协同决策的 半物理仿真实验系统,开展实验的结果表明,机器人通过学习驾驶员先验模型和自主训练,其决策效果可接近驾驶员决策水平, 同时人机协同决策指令可有效弥补单智能体决策指令的缺陷,在规则沟壑地形下协同决策指令的碰撞率指标优于驾驶员单智 能体指令 23. 8% ,障碍地形下协同决策指令的能量消耗指标优于机器自主单智能体指令 34. 1% 。