淄博市知识产权公共服务平台

导航
专利号 202411008772X 申请日 2024-07-26 专利名称 基于扩散模型的多样性可控文本生成方法和装置
授权日 2024-09-27 专利权人 山东大学 发明人 孙宇清;韩雨辰;龚斌
主分类号 G06F40/16 关键词 应用领域
摘要 本发明属于自然语言处理的技术领域,具体涉及一种基于扩散模型的多样性可控文本生成方法和装置。所述方法包括:构建包括自然语言提示编码器、文本重构自编码器、控制信息聚类模型和隐空间扩散模型的多样性文本生成模型;在训练阶段,给定参考文本及包含任务需求和控制需求的自然语言提示,并将其输入多样性文本生成模型以进行模型训练;在应用阶段,给定自然语言提示,并将其输入训练好的多样性文本生成模型中,以逐步迭代生成符合相应控制的多样性文本。本发明将自然语言提示编码在隐空间中聚类,将自然语言控制转化成潜在的指令控制类别,根据提示控制类别分布采样控制信息,引导文本生成过程,实现对生成文本的控制。
创新点
技术分类 标 签 战兴产业 新一代信息技术    人工智能
运营方式 合作方式
联系人 联系电话 电子邮箱
详细说明
【关 闭】