淄博市知识产权公共服务平台

导航
专利号 2018113982321 申请日 2018-11-22 专利名称 一种基于有监督主题模型的文本分类方法及系统
授权日 2020-06-02 专利权人 山东工商学院 发明人 唐焕玲;窦全胜;于立萍;宋英杰;鲁眀羽
主分类号 G06F16/35 关键词 应用领域
摘要 本公开提供了一种基于有监督主题模型的文本分类方法及系统。其中,一种基于有监督主题模型的文本分类方法,包括:构建SLDA‑TC文本分类模型;在训练SLDA‑TC文本分类模型的过程中,按照SLDA‑TC‑Gibbs算法对每个词的隐含主题进行采样,且只从与该词所在文本类别标签相同的其它训练文本中进行隐含主题采样;在确定每个词的隐含主题之后,通过统计频次,计算得到文本‑主题概率分布、主题‑词概率分布和主题‑类别概率分布;建立主题与类别之间的准确映射;将待测文本输入至训练生成的SLDA‑TC文本分类模型,推断出待测文本的主题,进而预测文本的类别。
创新点
技术分类 标 签 战兴产业 新一代信息技术    下一代信息网络产业
运营方式 合作方式
联系人 联系电话 电子邮箱
详细说明
【关 闭】