淄博市知识产权公共服务平台

导航
专利号 2023108377344 申请日 2023-07-10 专利名称 基于对比学习及图嵌入优化的文本聚类方法及系统
授权日 2026-03-27 专利权人 济南大学 发明人 周劲;尉钰婕;周广;韩晓琳;韩士元;陈月辉;杜韬;杨程;刘博文
主分类号 G06F16/35 关键词 应用领域
摘要 本发明属于自然语言处理领域,提供了基于对比学习及图嵌入优化的文本聚类方法及系统,其技术方案为:采用对比学习并结合图嵌入方法,既考虑了数据的全局结构,又结合了特征的局部图结构。图嵌入充分利用原始高维样本空间的近邻先验信息,对低维表示空间的嵌入施加约束,以保证原始样本的连接强度在隐层特征中得到反映。利用样本和最近的邻居之间的相关性来弥补只依靠全局结构所造成的聚类中心偏差,达到提高聚类精度的目的,从而从高数据量、高稀疏的文本数据集中得到准确的聚类结果。
创新点
技术分类 标 签 战兴产业 新一代信息技术    下一代信息网络产业
运营方式 合作方式
联系人 联系电话 电子邮箱
详细说明
【关 闭】