| 专利号 | 2021102607837 | 申请日 | 2021-03-10 | 专利名称 | 一种基于示范数据强化学习技术的水下航行器自主上浮控制方法 |
| 授权日 | 2022-03-25 | 专利权人 | 山东大学 | 发明人 | 李沂滨;张天泽;缪旭弘;魏征;尤岳;周广礼;贾磊;庄英豪;宋艳 |
| 主分类号 | G06F30/28 | 关键词 | 应用领域 | ||
| 摘要 | 本发明涉及一种基于示范数据强化学习技术的水下航行器自主上浮控制方法,属于海洋设备控制技术领域,本发明基于深度强化学习中“演员‑评论家”算法框架,提出一种基于结合示范数据深度强化学习技术的水下航行器自主上浮控制方法。本发明基于DDPG算法,实现对连续动作空间水下航行器的上浮控制,并且在训练过程中使用示范数据,加速算法的收敛,同时对算法框架中的演员网络进行延迟更新,有效消除强化学习算法中存在的过估计问题。 | ||||
| 创新点 | |||||
| 技术分类 | 标 签 | 战兴产业 | 新一代信息技术  新兴软件和新型信息技术服务 | ||
| 运营方式 | 合作方式 | ||||
| 联系人 | 联系电话 | 电子邮箱 | |||
| 详细说明 | |||||