| 专利号 | 2022108382422 | 申请日 | 2022-07-18 | 专利名称 | 基于代码描述文本的技术特征关键词抽取方法与系统 |
| 授权日 | 2022-09-30 | 专利权人 | 山东大学 | 发明人 | 龚斌;宁祥东;孙宇清 |
| 主分类号 | G06F40/289 | 关键词 | 应用领域 | ||
| 摘要 | 一种基于代码描述文本的技术特征关键词抽取方法与系统,属于自然语言处理的技术领域。本发明综合考虑语义、句法和词汇特异性等代码技术特征相关信息,采用词汇知识和句子句法知识的融合分析方法,将共现词汇和依存关系相结合构建语义关联图;采用预训练模型BERT作为文本编码器,提取文本抽象语义信息;采用随机游走算法计算词汇权重,以捕获词汇之间的长距离语义依赖关系,兼顾关键词的重要性和特异性。 | ||||
| 创新点 | |||||
| 技术分类 | 标 签 | 战兴产业 | 新一代信息技术  人工智能 | ||
| 运营方式 | 合作方式 | ||||
| 联系人 | 联系电话 | 电子邮箱 | |||
| 详细说明 | |||||