淄博市知识产权公共服务平台

导航
专利号 2021110944739 申请日 2021-09-17 专利名称 一种基于多层次语义的文本识别方法及系统
授权日 2024-10-22 专利权人 山东师范大学 发明人 孔浩冉;白振昊;陈园
主分类号 G06F40/279 关键词 应用领域
摘要 本公开提供了一种基于多层次语义的文本识别方法及系统,获取待识别文本数据;提取文本数据的单词,得到各个单词的词向量;根据获取的词向量以及第一双向长短期记忆网络,得到单词的特征表示,结合第一注意力网络,得到不同视角下的词级别局部句子语义表示;根据获取的词级别的不同视角下的句子语义表示以及第二双向长短期记忆网络,得到句子的特征表示,结合第二注意力网络,得到不同视角下的句级别全局句子语义表示;根据得到的全局句子语义表示,得到文本识别结果;本公开不仅突出重要单词和句子对文本语义的贡献,而且从单一视角拓展为多视角文本语义提取,提高了文本识别的准确度。
创新点
技术分类 标 签 战兴产业 新一代信息技术    人工智能
运营方式 合作方式
联系人 联系电话 电子邮箱
详细说明
【关 闭】