| 专利号 | 202110406519X | 申请日 | 2021-04-15 | 专利名称 | 一种文本相似词汇检索方法、系统、介质及电子设备 |
| 授权日 | 2022-06-24 | 专利权人 | 山东师范大学 | 发明人 | 郑元杰;庄承阳;姜岩芸;刘弘;黄文慧 |
| 主分类号 | G06F16/335 | 关键词 | 应用领域 | ||
| 摘要 | 本公开提供了一种文本相似词汇检索方法、系统、介质及电子设备,获取文本中的待聚类的词语;根据获取的词语,得到词语、字符、子字符和笔画在构建词嵌入向量中的权重,根据权重得到最终的词嵌入向量;根据各个词语的词嵌入向量的夹角余弦值的差异进行文本中词语的聚类;本公开结合词语内部的笔画信息、子字符信息和字符信息,给予词语内部组件合理的权重,实现了词嵌入向量的联合优化,提高了词嵌入向量的质量,极大的提高了文本相似词汇检索的准确度。 | ||||
| 创新点 | |||||
| 技术分类 | 标 签 | 战兴产业 | 新一代信息技术  下一代信息网络产业 | ||
| 运营方式 | 合作方式 | ||||
| 联系人 | 联系电话 | 电子邮箱 | |||
| 详细说明 | |||||