| 专利号 | 202210638552X | 申请日 | 2022-06-08 | 专利名称 | 一种基于强化学习的水下航行器对接控制方法 |
| 授权日 | 2022-09-20 | 专利权人 | 山东大学 | 发明人 | 李沂滨;张天泽;缪旭弘;魏征;尤岳;周广礼;贾磊;庄英豪;宋艳 |
| 主分类号 | G05D1/06 | 关键词 | 应用领域 | ||
| 摘要 | 本发明涉及一种基于强化学习的水下航行器对接控制方法,属于海洋控制实验技术领域,本发明基于深度强化学习中的PPO算法框架,引入新旧策略更新的可靠边界,提升智能体学习的稳定性。同时,采用自适应回滚裁剪机制,根据收集到成功完成任务经验的情况自适应地调节回滚力度,从而调节新旧策略更新的上下限,从而鼓励智能体在训练初期进行探索,在训练后期稳定收敛。在仿真训练方面,本发明构建了考虑海流、海浪干扰的对接训练环境,使用此训练环境进行智能体的学习,大大提升了水下航行器的抗干扰能力。 | ||||
| 创新点 | |||||
| 技术分类 | 标 签 | 战兴产业 | 高端装备制造  卫星及应用产业 | ||
| 运营方式 | 合作方式 | ||||
| 联系人 | 联系电话 | 电子邮箱 | |||
| 详细说明 | |||||