淄博市知识产权公共服务平台

导航
专利号 202210638552X 申请日 2022-06-08 专利名称 一种基于强化学习的水下航行器对接控制方法
授权日 2022-09-20 专利权人 山东大学 发明人 李沂滨;张天泽;缪旭弘;魏征;尤岳;周广礼;贾磊;庄英豪;宋艳
主分类号 G05D1/06 关键词 应用领域
摘要 本发明涉及一种基于强化学习的水下航行器对接控制方法,属于海洋控制实验技术领域,本发明基于深度强化学习中的PPO算法框架,引入新旧策略更新的可靠边界,提升智能体学习的稳定性。同时,采用自适应回滚裁剪机制,根据收集到成功完成任务经验的情况自适应地调节回滚力度,从而调节新旧策略更新的上下限,从而鼓励智能体在训练初期进行探索,在训练后期稳定收敛。在仿真训练方面,本发明构建了考虑海流、海浪干扰的对接训练环境,使用此训练环境进行智能体的学习,大大提升了水下航行器的抗干扰能力。
创新点
技术分类 标 签 战兴产业 高端装备制造    卫星及应用产业
运营方式 合作方式
联系人 联系电话 电子邮箱
详细说明
【关 闭】