发布时间:2021-11-09 10:24 原文链接: 深度神经网络静态代码分析研究

  近日,中国科学院软件研究所智能软件研究中心研究员武延军、吴敬征课题组在基于深度神经网络的静态代码分析研究中取得进展。课题组提出了基于多类型和多粒度的语义代码表示学习模型——MultiCode,解决了工业场景中涉及多需求的开发任务时面临的开发开销大、模型集成困难、可扩展性受限等问题,实现了在多需求工业场景下的高效开发和准确预测,在漏洞检测、代码克隆检测等任务中得到了具体实践,并获得实际应用。

  基于深度神经网络的静态代码分析方法通常在不同代码分析任务中引入针对性设计,导致模型呈现高度多样化的态势。在工业领域,该现象会使开发者在开发涉及多需求的代码分析平台时,面临开发开销大、模型集成困难、可扩展性受限等问题。

  针对上述问题,MultiCode模型能够学习代码中多种类型和粒度的语义信息,进而支撑多种代码分析任务。课题组提出使用抽象语法树、控制流图、程序依赖图等结构,对代码中不同类型和粒度的语义信息进行建模,并利用树神经网络和图神经网络分别对不同的语义信息进行处理。在该过程中,MultiCode模型自底向上地先学习语句级别的表示,再基于该表示学习代码段级别的表示。将该模型作为编码器进行神经网络构建,能够有效适配于不同的代码分析任务。在漏洞检测和代码克隆检测任务上的评估结果表明,其能够在不需要重新构建编码器的情况下,在不同任务中有效地识别并区分不同类别代码的语义,进而支撑多种任务上的预测。

  相关研究成果以MultiCode: A Unified Code Analysis Framework based on Multi-type and Multi-granularity Semantic Learning为题,发表在软件可靠性工程国际会议(ISSRE 2021)的Industry Track上,并被评为最佳实践论文。研究工作得到国家重点研发计划、国家自然科学基金的支持。

  MultiCode基于多类型和多粒度的语义代码表示学习模型框架

  ISSRE 2021最佳实践论文奖

相关文章

川大团队揭示神经元进化缺失的一环,填补神经元空白

1997年,从高中考上北京大学生命科学学院以来,26年间陈强始终在和生命科学打交道。从北大博士毕业之后,他来到哈佛大学医学院做了6年的博士后研究。2013年,陈强回国加入四川大学生物治疗国家重点实验室......

Nature:神经退变和脑衰老过程中神经元DNA修复新机制

近期,Nature 发表了题为:ANPAS4‐NuA4ComplexCouplesSynapticActivitytoDNARepair的研究论文【1】,揭示了神经元在外部刺激下维持基因组稳......

效仿人脑节能,可用于AI的大型类脑神经网络实现

在《自然·机器智能》杂志上发表的一项新研究中,荷兰国家数学与计算机科学研究所(CWI)科学家展示了类脑神经元如何与新颖的学习方法相结合,能够大规模训练快速节能的尖峰神经网络。潜在的应用包括可穿戴人工智......

追“新”逐“绿”

4月25日,中国联通(青岛)智算中心一期正式启用;全国一体化算力网络国家(贵州)枢纽节点近期接入首批客户……算力基础设施建设和应用正加速推进。工信部最新数据显示,我国梯次优化的算力供给体系初步构建,算......

科学家有望开发出人类罕见的神经胶细胞瘤的新型疗法

弥漫型内因性桥脑神经胶细胞瘤(DIPG,DiffuseIntrinsicPontineGlioma)是一种致命性的小儿脑瘤,患者常常会在诊断后的一年内死亡,由于肿瘤的位置,进行手术几乎是不可能的,化疗......

科学家阐明摄食全过程的序列性神经调控机制

自然环境变幻莫测。自然界中的动物即使在摄食过程中也需要时刻关注环境中的各种线索,一方面有助于及时发现危险,另一方面利于获取更多资源。长期以来,由于缺乏细致分析动物多种自发行为的手段,科学家主要利用摄食......

刘明院士团队:自旋神经形态器件研究新进展

生物启发脉冲神经网络架构有望通过模拟人脑的高算力、高并行度、低功耗等特性,解决冯·诺依曼架构存储墙和能效瓶颈等问题。然而,面向构建脉冲神经网络的神经形态硬件的研究尚处于探索阶段,基于传统CMOS的神经......

提升全社会网络法治意识和素养

“2022全国互联网法律法规知识云大赛”吸引超220万人报名参赛,竞赛访问量逾1.64亿;广泛发动网民进行创作,从网上征集作品再把获奖作品在网上推送展播,法治动漫微视频征集展播活动已连续开展18届;目......

新材料实现视神经最长距离再生

记者27日从首都医科大学获悉,该校教授李晓光团队在暨南大学苏国辉院士团队指导下,联合北京同仁医院王宁利教授团队,利用生物活性材料(睫状神经营养因子壳聚糖)促进成年大鼠完全离断的视神经长距离再生,并恢复......

中科院微电子所在图网络存内计算方面获重要进展

深度学习技术作为AI的重要引擎,近年来受到广泛关注和飞速发展。图神经网络(GraphNeuralNetwork)是一种较新的深度学习技术,可用于处理更复杂的非结构化数据,广泛应用于社交网络、电子购物、......