| 专利号 | 2022102288164 | 申请日 | 2022-03-08 | 专利名称 | 一种语义相似度向量再稀疏编码索引与检索方法 |
| 授权日 | 2024-10-11 | 专利权人 | 中国海洋大学 | 发明人 | 许晓伟;刘振宇;魏智敏;王晓东;曹媛;王成林 |
| 主分类号 | G06F16/33 | 关键词 | 应用领域 | ||
| 摘要 | 本发明属于信息检索技术领域,公开了一种语义相似度向量再稀疏编码索引与检索方法,索引构建时首先利用深度学习语义相似度模型将输入的文本数据生成保存了文本语句语义信息的稠密语义向量;然后将稠密语义向量再稀疏编码为保存了语义信息的字符串;再将生成的字符串存入索引库中的不同字段进行倒排序索引,对所有文档建立倒排索引。在检索时,使用搜索引擎对包含语义信息的字符串进行检索,并召回语义相似文本Top‑N。通过本发明的方法,保留深度学习语义模型向量的表征特性,有效排除召回阶段的误差,提高语义检索的准确率。 | ||||
| 创新点 | |||||
| 技术分类 | 标 签 | 战兴产业 | 新一代信息技术  下一代信息网络产业 | ||
| 运营方式 | 合作方式 | ||||
| 联系人 | 联系电话 | 电子邮箱 | |||
| 详细说明 | |||||