淄博市知识产权公共服务平台

导航
专利号 2024112519982 申请日 2024-09-09 专利名称 通过预训练BERT进行化学生产命名实体识别的方法
授权日 2025-01-21 专利权人 中国石油大学(华东) 发明人 宋弢;王珣;王爽;韩佩甫
主分类号 G06F40/295 关键词 应用领域
摘要 本发明属于实体识别技术领域,特别涉及通过预训练BERT进行化学生产命名实体识别的方法。该方法包括S1、将需要识别的文本输送到预训练的LM嵌入模型ChemBERT中,从而获得语义表示向量和语义检索库;S2、将解码器应用到步骤S1的语义表示向量上;S3、使用解码标签和KNN聚类标签进行投票,投票的结果用作最终输出。该方法解决了现有的实体识别方法出现的数据集中存在长尾数据和小样本数据的问题。
创新点
技术分类 标 签 战兴产业 新一代信息技术    人工智能
运营方式 合作方式
联系人 联系电话 电子邮箱
详细说明
【关 闭】