| 专利号 | 2019113679795 | 申请日 | 2019-12-26 | 专利名称 | 基于网址域名的文本分词方法、系统、设备及介质 |
| 授权日 | 2023-09-26 | 专利权人 | 济南大学 | 发明人 | 杜韬;李依谦;曲守宁;朱连江;王信堂;王希普 |
| 主分类号 | G06F40/289 | 关键词 | 应用领域 | ||
| 摘要 | 本发明公开了基于网址域名的文本分词方法、系统、设备及介质,包括:数据采集,采集若干个网址域名;对每个网址域名进行分词处理;将分词处理后的单词进行文本格式化处理;分析文本格式化处理后得到单词的单词词性;根据单词词性进行词形还原;将词形还原后的结果存储到单词库中;将待分词的网址域名,采用双向最大匹配算法与单词库进行匹配,如果匹配成功,则得到文本向量化结果;如果匹配失败,则对待分词的网址域名进行清洗,将清洗后的结果再次采用双向最大匹配算法与单词库进行匹配。 | ||||
| 创新点 | |||||
| 技术分类 | 标 签 | 战兴产业 | 新一代信息技术  人工智能 | ||
| 运营方式 | 合作方式 | ||||
| 联系人 | 联系电话 | 电子邮箱 | |||
| 详细说明 | |||||