淄博市知识产权公共服务平台

导航
专利号 2017101730293 申请日 2017-03-22 专利名称 基于大数据的创新创意标签自动标注方法及系统
授权日 2020-12-01 专利权人 山东大学 发明人 鹿旭东;张盘龙;陈志勇;郭伟;崔立真
主分类号 G06F16/35 关键词 应用领域
摘要 本发明公开了基于大数据的创新创意标签自动标注方法及系统,所述方法包括:使用搜狗语料库训练Word2vector和LDA得到训练结果集。将用户浏览页面的文档数据进行分词、去除停用词和词过滤处理。将预处理的文档数据,通过使用改进的TextRank算法Word2vector相结合计算出来源于本文数据的标签。并且将预处理的文档通过LDA计算得出关于文档数据主题的标签。通过生成标签云的方式实现可视化,并且将所有的本文标签词语在文档数据中标注出来,方便用户进行阅读和发现重点内容部分。
创新点
技术分类 标 签 战兴产业 新一代信息技术    下一代信息网络产业
运营方式 合作方式
联系人 联系电话 电子邮箱
详细说明
【关 闭】