| 专利号 | 2022105420386 | 申请日 | 2022-05-18 | 专利名称 | 基于对比学习的网页图卷积文档排序方法及系统 |
| 授权日 | 2024-05-10 | 专利权人 | 山东大学 | 发明人 | 任鹏杰;石超宇;任昭春;陈竹敏;颜强 |
| 主分类号 | G06F16/835 | 关键词 | 应用领域 | ||
| 摘要 | 本公开提供了一种基于对比学习的网页图卷积文档排序方法及系统,其属于网页文档排序技术领域,所述方案包括:获取待查询内容的向量表示以及待排序网页HTML序列;基于预先训练的序列编码模型,将所述HTML序列编码为若干标记信息组成的隐藏表示序列;基于位置索引从所述隐藏表示序列中提取网页标签表示,并基于单向图表示或对称图表示方法,以标签表示构建图节点,以网页DOM树中父节点与子节点之间的关系构建图的边,实现网页图的构建;基于关系图卷积神经网络对上所述网页图进行编码,获得网页图的向量表示;基于多层感知机方法,计算待查询内容向量表示与网页图的向量表示之间的相似度,并基于所述相似度大小实现相关网页的排序。 | ||||
| 创新点 | |||||
| 技术分类 | 标 签 | 战兴产业 | 新一代信息技术  下一代信息网络产业 | ||
| 运营方式 | 合作方式 | ||||
| 联系人 | 联系电话 | 电子邮箱 | |||
| 详细说明 | |||||