淄博市知识产权公共服务平台

导航
专利号 2021107072284 申请日 2021-06-24 专利名称 基于TF-IDF的主题词提取方法、装置、设备及存储介质
授权日 2023-02-07 专利权人 青岛科技大学 发明人 王华东;张津烽;王军
主分类号 G06F40/242 关键词 应用领域
摘要 本申请公开了一种基于TF‑IDF的主题词提取方法、装置、设备及存储介质,属于主题词提取领域。该方法包括:获取多个商品描述文本并进行分词处理;根据目标分词在目标文本中出现的频率以及目标分词的逆向文本频率得到目标分词的第一权值;根据目标分词的词性得到第二权值;根据目标分词在目标文本中的位置得到第三权值;根据目标分词在多个商品描述文本出现的次数得到第四权值;根据第一权值、第二权值、第三权值以及第四权值确定目标分词的目标权值,根据目标权值得到目标文本的主题词提取结果。本申请提高主题词的识别提取准确率,具备一定的实际应用价值。
创新点
技术分类 标 签 战兴产业 新一代信息技术    人工智能
运营方式 合作方式
联系人 联系电话 电子邮箱
详细说明
【关 闭】