| 专利号 | 2021102400367 | 申请日 | 2021-03-04 | 专利名称 | 基于深度强化学习的变质量水下航行器避障方法及系统 |
| 授权日 | 2022-04-29 | 专利权人 | 山东大学 | 发明人 | 李沂滨;李沐阳;缪旭弘;魏征;尤岳;周广礼;贾磊;庄英豪;宋艳 |
| 主分类号 | G06F30/15 | 关键词 | 应用领域 | ||
| 摘要 | 本发明公开一种基于深度强化学习的变质量水下航行器避障方法及系统,包括:根据变质量水下航行器的运动状态和执行机构动作构建基于深度强化学习网络的避障仿真模型;将历史避障任务完整轨迹作为专家数据存入经验回放池,根据变质量水下航行器初始运动状态和高斯噪声得到当前执行动作,根据当前执行动作得到新运行状态和当前执行动作的奖励值,并存入经验回放池;根据经验回放池对避障仿真模型进行训练,根据当前训练的执行动作奖励值和历史训练的奖励平均值更新高斯噪声;以迭代训练完成后的基于深度强化学习网络的避障仿真模型得到变质量水下航行器避障任务行驶路径。对基于深度强化学习的DDPG网络模型进行改进,解决水下航行器的避障问题。 | ||||
| 创新点 | |||||
| 技术分类 | 标 签 | 战兴产业 | 新一代信息技术  新兴软件和新型信息技术服务 | ||
| 运营方式 | 合作方式 | ||||
| 联系人 | 联系电话 | 电子邮箱 | |||
| 详细说明 | |||||