淄博市知识产权公共服务平台

导航
专利号 2023109533532 申请日 2023-07-31 专利名称 一种基于词汇语义增强的句子相似度计算方法
授权日 2024-09-17 专利权人 山东科技大学 发明人 潘正祥;王潇;朱淑娟;杨东强
主分类号 G06F40/211 关键词 应用领域
摘要 本发明公开了一种基于词汇语义增强的句子相似度计算方法,属于自然语言处理领域,包括如下步骤:步骤1、获取源数据和词汇约束集合;步骤2、对源数据和词汇约束集合进行预处理;步骤3、采用主成分分析法对第二数据进行降维处理,提取词向量中的主要特征,得到第三数据;步骤4、针对不同的词汇约束集合构建不同的损失函数;步骤5、进行分布式词向量优化;步骤6、计算两个句子的余弦相似度。本发明针对句子相似度,对句子中词汇的向量表示进行了加工处理,可以使得句子相似度的分析更加准确,解决目前句子对比相似度低下的问题。
创新点
技术分类 标 签 战兴产业 新一代信息技术    人工智能
运营方式 合作方式
联系人 联系电话 电子邮箱
详细说明
【关 闭】