| 专利号 | 2025107405469 | 申请日 | 2025-06-05 | 专利名称 | 一种面向大模型服务的任务并行处理智能调度方法及系统 |
| 授权日 | 2025-08-12 | 专利权人 | 山东财经大学 | 发明人 | 李秀林;张召国;李琳 |
| 主分类号 | G06F9/48 | 关键词 | 应用领域 | ||
| 摘要 | 本发明提出了一种面向大模型服务的任务并行处理智能调度方法及系统,属于服务计算技术领域,包括:采用LaBSE模型对并行子任务的指令和文本提取语义特征并生成嵌入向量,并通过压缩模块降低嵌入向量的向量维度,将压缩后的嵌入向量输入回归器中预测生成长度;构建基于语义完整性约束的分割算法,将文本分割形成文本片段列表;采用多约束的任务分批算法,根据长度相近约束和同一指令约束,将文本片段列表中分割好的文本片段分到不同批次的任务,得到批任务集合;采用面向异构资源的任务分配算法优化批任务集合,确定优化后的子任务调度方案。本发明实现大模型服务的高效并行处理,显著提升了推理速度、资源利用率和任务调度的智能化水平。 | ||||
| 创新点 | |||||
| 技术分类 | 标 签 | 战兴产业 | 新一代信息技术  下一代信息网络产业 | ||
| 运营方式 | 合作方式 | ||||
| 联系人 | 联系电话 | 电子邮箱 | |||
| 详细说明 | |||||