专利号 | 2024112803480 | 申请日 | 2024-09-13 | 专利名称 | 一种基于稀疏奖励的无人机机动策略生成方法 |
授权日 | 2025-03-11 | 专利权人 | 中国人民解放军海军航空大学 | 发明人 | 付宇鹏;邓向阳;方君;徐涛;余应福;朱子强;王萌 |
主分类号 | G06F30/27 | 关键词 | 应用领域 | ||
摘要 | 本发明涉及一种基于稀疏奖励的无人机机动策略生成方法,属于机动策略生成方法技术领域。为了解决现有技术中提到的稀疏奖励任务收敛慢的问题,该方法包括轨迹收集:分布式执行者与环境独立交互,将其轨迹进行收集并计算折扣回报,并将收集到的轨迹存储到用于离线策略训练的全局回放经验池;更新学习者的策略网络和价值网络模型:更新执行者的策略网络模型:学习者将策略网络参数发布给每个执行者,从而更新所有执行者的策略网络模型,每个执行者利用参数掩码,随机重塑嵌入网络的非活动权重,增加策略随机性从而提高环境探索能力,该方法既提高了算法的收敛性,也提高了无人机的机动能力。 | ||||
创新点 | |||||
技术分类 | 标 签 | 战兴产业 | 新一代信息技术  新兴软件和新型信息技术服务 | ||
运营方式 | 合作方式 | ||||
联系人 | 联系电话 | 电子邮箱 | |||
详细说明 |