淄博市知识产权公共服务平台

导航
专利号 2024112803480 申请日 2024-09-13 专利名称 一种基于稀疏奖励的无人机机动策略生成方法
授权日 2025-03-11 专利权人 中国人民解放军海军航空大学 发明人 付宇鹏;邓向阳;方君;徐涛;余应福;朱子强;王萌
主分类号 G06F30/27 关键词 应用领域
摘要 本发明涉及一种基于稀疏奖励的无人机机动策略生成方法,属于机动策略生成方法技术领域。为了解决现有技术中提到的稀疏奖励任务收敛慢的问题,该方法包括轨迹收集:分布式执行者与环境独立交互,将其轨迹进行收集并计算折扣回报,并将收集到的轨迹存储到用于离线策略训练的全局回放经验池;更新学习者的策略网络和价值网络模型:更新执行者的策略网络模型:学习者将策略网络参数发布给每个执行者,从而更新所有执行者的策略网络模型,每个执行者利用参数掩码,随机重塑嵌入网络的非活动权重,增加策略随机性从而提高环境探索能力,该方法既提高了算法的收敛性,也提高了无人机的机动能力。
创新点
技术分类 标 签 战兴产业 新一代信息技术    新兴软件和新型信息技术服务
运营方式 合作方式
联系人 联系电话 电子邮箱
详细说明
【关 闭】