专利号 | 202510018253X | 申请日 | 2025-01-07 | 专利名称 | 一种提高深度算子网络模型推理求解和训练速度的方法 |
授权日 | 2025-04-29 | 专利权人 | 中国石油大学(华东) | 发明人 | 王珣;宋弢;朱先禧 |
主分类号 | G06N5/04 | 关键词 | 应用领域 | ||
摘要 | 本发明属于人工智能及高性能计算技术领域,特别涉及一种提高深度算子网络模型推理求解和训练速度的方法。本发明针对PI‑DeepONet模型进行多层次的优化,提高其推理求解速度和训练速度。本发明定制SGEMM算子,在PI‑DeepONet常用的模型尺寸范围内,SGEMM算子相较于CUDA计算平台的基础线性代数库中最好的单精度矩阵乘法可取得最高1.5倍的加速比。针对模型中使用的modified MLP的特殊结构设计融合算子,模型的端到端推理速度获得2倍以上的加速比,图形处理器计算时间最高可被缩短5.7倍。本发明使用数据并行对模型进行分布式训练,并使用通信掩盖的策略,可扩展性保持在83%‑85%。 | ||||
创新点 | |||||
技术分类 | 标 签 | 战兴产业 | 新一代信息技术  人工智能 | ||
运营方式 | 合作方式 | ||||
联系人 | 联系电话 | 电子邮箱 | |||
详细说明 |