| 专利号 | 2023109533532 | 申请日 | 2023-07-31 | 专利名称 | 一种基于词汇语义增强的句子相似度计算方法 |
| 授权日 | 2024-09-17 | 专利权人 | 山东科技大学 | 发明人 | 潘正祥;王潇;朱淑娟;杨东强 |
| 主分类号 | G06F40/211 | 关键词 | 应用领域 | ||
| 摘要 | 本发明公开了一种基于词汇语义增强的句子相似度计算方法,属于自然语言处理领域,包括如下步骤:步骤1、获取源数据和词汇约束集合;步骤2、对源数据和词汇约束集合进行预处理;步骤3、采用主成分分析法对第二数据进行降维处理,提取词向量中的主要特征,得到第三数据;步骤4、针对不同的词汇约束集合构建不同的损失函数;步骤5、进行分布式词向量优化;步骤6、计算两个句子的余弦相似度。本发明针对句子相似度,对句子中词汇的向量表示进行了加工处理,可以使得句子相似度的分析更加准确,解决目前句子对比相似度低下的问题。 | ||||
| 创新点 | |||||
| 技术分类 | 标 签 | 战兴产业 | 新一代信息技术  人工智能 | ||
| 运营方式 | 合作方式 | ||||
| 联系人 | 联系电话 | 电子邮箱 | |||
| 详细说明 | |||||