淄博市知识产权公共服务平台

导航
专利号 202110411676X 申请日 2021-04-16 专利名称 基于分层对比学习的代码特征提取方法及系统
授权日 2024-10-15 专利权人 山东师范大学 发明人 吕晨;王潇;高学剑;吴琼;马正;高曰秀;李季;吕蕾;刘弘
主分类号 G06F8/73 关键词 应用领域
摘要 本发明公开了基于分层对比学习的代码特征提取方法及系统,包括:获取待处理代码;对待处理代码片段进行解析,生成AST树;对AST树进行嵌入表示得到特征矩阵X,构造AST树的邻接矩阵A;以AST树的每个节点在AST树中的层次编号,建立节点标签;基于节点标签对特征矩阵X进行更新,得到新的特征矩阵X';将新的特征矩阵X'和邻接矩阵A,输入到训练后的残差自注意力网络模型中,得到待处理代码的特征;通过AST提取程序的语法信息,同时对解析的AST按节点的层次赋予标签进行分类,建立单标签多分类的关系,充分挖掘程序的结构信息,使得生成模型的表达能力更全面更准确。
创新点
技术分类 标 签 战兴产业 新一代信息技术    互联网与云计算、大数据服务
运营方式 合作方式
联系人 联系电话 电子邮箱
详细说明
【关 闭】