| 专利号 | 2021110051921 | 申请日 | 2021-08-30 | 专利名称 | 基于长文本特征提取优化的媒体假新闻检测方法及系统 |
| 授权日 | 2024-08-23 | 专利权人 | 济南大学 | 发明人 | 马坤;汤长昊;纪科;杨波;陈贞翔 |
| 主分类号 | G06F16/35 | 关键词 | 应用领域 | ||
| 摘要 | 本发明提供了一种基于长文本特征提取优化的媒体假新闻检测方法及系统,对获取的媒体数据进行预处理;对预处理后的媒体数据根据数据对齐的统一长度分为长文本与短文本,并采用不同方式提取相应类别的新闻文本特征,输出文本特征的向量化表示;根据所述媒体数据的应用场景,利用不同的预训练后的深度学习分类模型对文本特征的向量化表示进行真假性预测,得到检测结果。本发明能够减少数据噪声问题,解决自编码模型存在的预训练‑微调阶段的学习偏差,降低特征维度,解决长文本信息丢失问题,提高特征学习能力。 | ||||
| 创新点 | |||||
| 技术分类 | 标 签 | 战兴产业 | 新一代信息技术  下一代信息网络产业 | ||
| 运营方式 | 合作方式 | ||||
| 联系人 | 联系电话 | 电子邮箱 | |||
| 详细说明 | |||||