淄博市知识产权公共服务平台

导航
专利号 2024106343691 申请日 2024-05-22 专利名称 一种基于子树库的多样性可控文本改写方法及装置
授权日 2024-07-30 专利权人 山东大学 发明人 孙宇清;韩雨辰;刘天元
主分类号 G06F40/166 关键词 应用领域
摘要 本发明属于自然语言处理的技术领域,具体涉及一种基于子树库的多样性可控文本改写方法及装置。该方法包括:根据句法结构子树的特征表示以及公开语料库中每个语句的依存句法树构建子树库;从给定原始文本的原句依存句法树中选取被替换子树,并在子树库中选取满足约束性条件的替换子树,构成候选子树集合;从候选子树集合中随机选取目标替换子树,并使用目标替换子树替换原始文本中所选取的被替换子树,生成新的多样性依存句法树,最后基于新的多样性依存句法树进行原始文本的可控文本改写。本发明通过从子树库中检索出功能一致且形态相似且差异的子树,并在原句依存句法树基础上构造多样性句法结构,实现多样性的句法可控文本改写。
创新点
技术分类 标 签 战兴产业 新一代信息技术    人工智能
运营方式 合作方式
联系人 联系电话 电子邮箱
详细说明
【关 闭】