淄博市知识产权公共服务平台

导航
专利号 2023109737972 申请日 2023-08-04 专利名称 融合规则和统计特征的中文专业术语抽取方法和系统
授权日 2023-11-17 专利权人 山东大学 发明人 孙宇清;李成;龚斌
主分类号 G06F40/295 关键词 应用领域
摘要 一种融合规则和统计特征的中文专业术语抽取方法和系统,属于自然语言处理的技术领域,包括:在专业术语发现部分,采用自然语言处理领域通用的包含词频统计词典和概率算法的分词工具。在专业术语筛选阶段,提出了基于统计的词频、词条数、点互信息、词汇自由度、信息量差异比等专业术语抽取指标和抽取技术,将分词结果中的专业术语从通用词汇或概念中提取出来。在评估优化阶段,提出基于专业术语在专业文本和通用文本中的信息量差异的评价指标和优化技术,从语用规律和上下文两个角度对候选结果进行评价和优化提取。
创新点
技术分类 标 签 战兴产业 新一代信息技术    人工智能
运营方式 合作方式
联系人 联系电话 电子邮箱
详细说明
【关 闭】