淄博市知识产权公共服务平台

导航
专利号 202510018253X 申请日 2025-01-07 专利名称 一种提高深度算子网络模型推理求解和训练速度的方法
授权日 2025-04-29 专利权人 中国石油大学(华东) 发明人 王珣;宋弢;朱先禧
主分类号 G06N5/04 关键词 应用领域
摘要 本发明属于人工智能及高性能计算技术领域,特别涉及一种提高深度算子网络模型推理求解和训练速度的方法。本发明针对PI‑DeepONet模型进行多层次的优化,提高其推理求解速度和训练速度。本发明定制SGEMM算子,在PI‑DeepONet常用的模型尺寸范围内,SGEMM算子相较于CUDA计算平台的基础线性代数库中最好的单精度矩阵乘法可取得最高1.5倍的加速比。针对模型中使用的modified MLP的特殊结构设计融合算子,模型的端到端推理速度获得2倍以上的加速比,图形处理器计算时间最高可被缩短5.7倍。本发明使用数据并行对模型进行分布式训练,并使用通信掩盖的策略,可扩展性保持在83%‑85%。
创新点
技术分类 标 签 战兴产业 新一代信息技术    人工智能
运营方式 合作方式
联系人 联系电话 电子邮箱
详细说明
【关 闭】