| 专利号 | 2019107221347 | 申请日 | 2019-08-06 | 专利名称 | 中医文本分词过程中的消歧方法、系统、设备及介质 |
| 授权日 | 2023-08-11 | 专利权人 | 山东师范大学 | 发明人 | 袁锋;王冰;郑向伟;于凤洋 |
| 主分类号 | G06F40/289 | 关键词 | 应用领域 | ||
| 摘要 | 本公开公开了中医文本分词过程中的消歧方法,包括:获取待分词的中医文本;对中医文本进行预处理;对预处理后的中医文本进行分词处理;对分词处理后的结果与预先构建的组合歧义词库进行匹配,从分词处理后的结果中,筛选出组合歧义词和非组合歧义词;将非组合歧义词存储到分词结果数据库中;对筛选出的组合歧义词进行词频和词性标记,根据筛选出的组合歧义词的词性和词频,计算出当前组合歧义词的互信息向量,将互信息向量输入到预先训练好的支持向量机模型中,输出当前组合歧义词的类别是否为可拆分类别;根据类别实现对当前组合歧义词的拆分或不拆分处理。消除了中医文本分词过程中组合型词汇的正确分词,实现组合型中医词汇的准确消歧。 | ||||
| 创新点 | |||||
| 技术分类 | 标 签 | 战兴产业 | 新一代信息技术  人工智能 | ||
| 运营方式 | 合作方式 | ||||
| 联系人 | 联系电话 | 电子邮箱 | |||
| 详细说明 | |||||