淄博市知识产权公共服务平台

导航
专利号 2024109390923 申请日 2024-07-15 专利名称 面向行业大模型的多层次主题式检索增强生成方法及系统
授权日 2024-09-27 专利权人 山东大学 发明人 史玉良;吕梁;王新军;闫中敏;陈志勇;程林
主分类号 G06F16/33 关键词 应用领域
摘要 本发明属于大语言模型与信息检索领域,提供了一种面向行业大模型的多层次主题式检索增强生成方法及系统,本发明构建了基于语义主题演化学习的长文本分割模型,实现了文档知识的有效切分,避免了段落语义丢失和异常句式的出现。同时,基于主题模型的生成能力,在文档层次生成主题内容,实现文档‑段落两个层次的语义关联,对知识进行更好的管理。在此基础上,本发明构建了多层次主题相似检索方法,在文档‑段落两个层次上进行目标问题的相似检索,减少噪音段落的出现,优化大语言模型提示工程中的候选集内容,从而提高大语言模型应用在目标行业领域知识问答系统的专业性和可靠性。
创新点
技术分类 标 签 战兴产业 新一代信息技术    下一代信息网络产业
运营方式 合作方式
联系人 联系电话 电子邮箱
详细说明
【关 闭】