| 专利号 | 2017101730293 | 申请日 | 2017-03-22 | 专利名称 | 基于大数据的创新创意标签自动标注方法及系统 |
| 授权日 | 2020-12-01 | 专利权人 | 山东大学 | 发明人 | 鹿旭东;张盘龙;陈志勇;郭伟;崔立真 |
| 主分类号 | G06F16/35 | 关键词 | 应用领域 | ||
| 摘要 | 本发明公开了基于大数据的创新创意标签自动标注方法及系统,所述方法包括:使用搜狗语料库训练Word2vector和LDA得到训练结果集。将用户浏览页面的文档数据进行分词、去除停用词和词过滤处理。将预处理的文档数据,通过使用改进的TextRank算法Word2vector相结合计算出来源于本文数据的标签。并且将预处理的文档通过LDA计算得出关于文档数据主题的标签。通过生成标签云的方式实现可视化,并且将所有的本文标签词语在文档数据中标注出来,方便用户进行阅读和发现重点内容部分。 | ||||
| 创新点 | |||||
| 技术分类 | 标 签 | 战兴产业 | 新一代信息技术  下一代信息网络产业 | ||
| 运营方式 | 合作方式 | ||||
| 联系人 | 联系电话 | 电子邮箱 | |||
| 详细说明 | |||||