一种基于稀疏奖励的无人机机动策略生成方法

专利号	2024112803480	申请日	2024-09-13	专利名称	一种基于稀疏奖励的无人机机动策略生成方法
授权日	2025-03-11	专利权人	中国人民解放军海军航空大学	发明人	付宇鹏;邓向阳;方君;徐涛;余应福;朱子强;王萌
主分类号	G06F30/27	关键词		应用领域
摘要	本发明涉及一种基于稀疏奖励的无人机机动策略生成方法，属于机动策略生成方法技术领域。为了解决现有技术中提到的稀疏奖励任务收敛慢的问题，该方法包括轨迹收集：分布式执行者与环境独立交互，将其轨迹进行收集并计算折扣回报，并将收集到的轨迹存储到用于离线策略训练的全局回放经验池；更新学习者的策略网络和价值网络模型：更新执行者的策略网络模型：学习者将策略网络参数发布给每个执行者，从而更新所有执行者的策略网络模型，每个执行者利用参数掩码，随机重塑嵌入网络的非活动权重，增加策略随机性从而提高环境探索能力，该方法既提高了算法的收敛性，也提高了无人机的机动能力。
创新点
技术分类		标签		战兴产业	新一代信息技术新兴软件和新型信息技术服务
运营方式				合作方式
联系人		联系电话		电子邮箱
详细说明