| 专利号 | 2020113191657 | 申请日 | 2020-11-23 | 专利名称 | 一种基于伪孪生网络的多语言代码剽窃检测方法 |
| 授权日 | 2024-03-12 | 专利权人 | 山东理工大学 | 发明人 | 刘聪;李国繁;张峰;李会玲;李彩虹;王绍卿 |
| 主分类号 | G06F8/70 | 关键词 | 应用领域 | ||
| 摘要 | 本发明公开了一种基于伪孪生网络的多语言代码剽窃检测方法,包括步骤:1)获取基础数据,包含预训练数据集和多语言代码剽窃检测训练数据集;2)对预训练数据集进行预处理获得精确的标记向量;3)对多语言代码剽窃检测训练数据集进行预处理初步判断代码是否剽窃;4)对多语言代码剽窃检测训练数据集中需进一步判断是否剽窃的代码进一步判断是否剽窃。本发明打破了现有基于机器学习的多语言代码剽窃检测方法将代码作为文本处理,未考虑代码结构特征的局限性,结合代码基于抽象语法树的结构特征,并将卷积神经网络、双向长短期记忆人工神经网络和新型注意力神经网络嵌入到伪孪生网络中,实现了多语言代码剽窃检测,有效提高检测代码剽窃的效率和精度。 | ||||
| 创新点 | |||||
| 技术分类 | 标 签 | 战兴产业 | 新一代信息技术  互联网与云计算、大数据服务 | ||
| 运营方式 | 合作方式 | ||||
| 联系人 | 联系电话 | 电子邮箱 | |||
| 详细说明 | |||||