专利号 | 2022109147913 | 申请日 | 2022-08-01 | 专利名称 | 一种基于多信息过滤编码的多标签文本分类方法及系统 |
授权日 | 2025-04-15 | 专利权人 | 济南大学 | 发明人 | 马坤;李乐平;纪科;陈贞翔;杨波 |
主分类号 | G06F16/335 | 关键词 | 应用领域 | ||
摘要 | 本发明公开了一种基于多信息过滤编码的多标签文本分类方法及系统,该方法包括:获取包含标签的文本训练集;基于文本训练集,得到文本和标签的单词向量;通过多信息过滤编码进行文本信息和标签信息的过滤和特征提取,得到过滤的文本特征和标签特征;通过过滤的文本特征和过滤的标签特征交互,结合过滤的文本特征,得到最终文本向量表示,以此训练多标签文本分类模型;利用训练好的多标签文本分类模型对待分类文本数据集进行多标签文本分类。本发明通过过滤文本信息和标签信息的噪音及冗余信息,分别在文本空间和标签空间提取过滤信息中的语义特征,通过过滤的语义特征的交互,捕获更多与分类相关的信息,提高多标签文本分类的精度。 | ||||
创新点 | |||||
技术分类 | 标 签 | 战兴产业 | 新一代信息技术  下一代信息网络产业 | ||
运营方式 | 合作方式 | ||||
联系人 | 联系电话 | 电子邮箱 | |||
详细说明 |