淄博市知识产权公共服务平台

导航
专利号 2019107221347 申请日 2019-08-06 专利名称 中医文本分词过程中的消歧方法、系统、设备及介质
授权日 2023-08-11 专利权人 山东师范大学 发明人 袁锋;王冰;郑向伟;于凤洋
主分类号 G06F40/289 关键词 应用领域
摘要 本公开公开了中医文本分词过程中的消歧方法,包括:获取待分词的中医文本;对中医文本进行预处理;对预处理后的中医文本进行分词处理;对分词处理后的结果与预先构建的组合歧义词库进行匹配,从分词处理后的结果中,筛选出组合歧义词和非组合歧义词;将非组合歧义词存储到分词结果数据库中;对筛选出的组合歧义词进行词频和词性标记,根据筛选出的组合歧义词的词性和词频,计算出当前组合歧义词的互信息向量,将互信息向量输入到预先训练好的支持向量机模型中,输出当前组合歧义词的类别是否为可拆分类别;根据类别实现对当前组合歧义词的拆分或不拆分处理。消除了中医文本分词过程中组合型词汇的正确分词,实现组合型中医词汇的准确消歧。
创新点
技术分类 标 签 战兴产业 新一代信息技术    人工智能
运营方式 合作方式
联系人 联系电话 电子邮箱
详细说明
【关 闭】