淄博市知识产权公共服务平台

导航
专利号 2025107868136 申请日 2025-06-13 专利名称 一种面向异构GPU集群的深度神经网络模型并行推理方法
授权日 2025-08-26 专利权人 山东大学 发明人 李峰;谢梦玮;胡鹏飞;吴思
主分类号 G06N5/04 关键词 应用领域
摘要 本发明公开了一种面向异构GPU集群的深度神经网络模型并行推理方法,涉及分布式机器学习领域,包括获取当前信息,剩余可选择的DNN模型、每个GPU服务器上已部署的DNN模型及未满足DNN模型数量约束的GPU服务器;调度器选择DNN模型部署在选定的GPU服务器上,并计算此时执行并行推理的吞吐量;直至找到吞吐量最大的DNN模型和GPU服务器组合,并更新相关信息;判断该GPU上已部署的DNN模型是否满足数量约束,并更新GPU集群信息,直到所有GPU满足特定的DNN模型数量约束;重复上述步骤直至算法收敛。本发明充分利用有限的异构GPU资源,选择相容性高的DNN模型进行部署执行并行推理,以最大化吞吐量。
创新点
技术分类 标 签 战兴产业 新一代信息技术    人工智能
运营方式 合作方式
联系人 联系电话 电子邮箱
详细说明
【关 闭】