发布时间:2021-11-09 10:24 原文链接: 深度神经网络静态代码分析研究

  近日,中国科学院软件研究所智能软件研究中心研究员武延军、吴敬征课题组在基于深度神经网络的静态代码分析研究中取得进展。课题组提出了基于多类型和多粒度的语义代码表示学习模型——MultiCode,解决了工业场景中涉及多需求的开发任务时面临的开发开销大、模型集成困难、可扩展性受限等问题,实现了在多需求工业场景下的高效开发和准确预测,在漏洞检测、代码克隆检测等任务中得到了具体实践,并获得实际应用。

  基于深度神经网络的静态代码分析方法通常在不同代码分析任务中引入针对性设计,导致模型呈现高度多样化的态势。在工业领域,该现象会使开发者在开发涉及多需求的代码分析平台时,面临开发开销大、模型集成困难、可扩展性受限等问题。

  针对上述问题,MultiCode模型能够学习代码中多种类型和粒度的语义信息,进而支撑多种代码分析任务。课题组提出使用抽象语法树、控制流图、程序依赖图等结构,对代码中不同类型和粒度的语义信息进行建模,并利用树神经网络和图神经网络分别对不同的语义信息进行处理。在该过程中,MultiCode模型自底向上地先学习语句级别的表示,再基于该表示学习代码段级别的表示。将该模型作为编码器进行神经网络构建,能够有效适配于不同的代码分析任务。在漏洞检测和代码克隆检测任务上的评估结果表明,其能够在不需要重新构建编码器的情况下,在不同任务中有效地识别并区分不同类别代码的语义,进而支撑多种任务上的预测。

  相关研究成果以MultiCode: A Unified Code Analysis Framework based on Multi-type and Multi-granularity Semantic Learning为题,发表在软件可靠性工程国际会议(ISSRE 2021)的Industry Track上,并被评为最佳实践论文。研究工作得到国家重点研发计划、国家自然科学基金的支持。

  MultiCode基于多类型和多粒度的语义代码表示学习模型框架

  ISSRE 2021最佳实践论文奖

相关文章

在动物大脑中直接修复DNA——神经科学研究新突破系列之一

神经元中基因编辑的插图。图片来源:杰克逊实验室哪怕在五年前,人们也会认为在活体大脑中进行DNA修复是科幻小说中才有的情节。但现在,科学家已能进入大脑、修复突变,并让细胞在整个生命周期中维持住这种修复效......

维生素B12水平新认知:为神经健康评估带来新启示

最近,《神经病学年鉴》(AnnalsofNeurology)发表的一项研究使用多模式测试方法,揭示了目前被认为是正常的维生素B12水平与神经损伤或功能障碍标志物之间的关联。维生素B12(也称为钴胺素)......

吉林大学研究人员开发高效液相色谱法测定脊髓中的神经递质

2025年2月18日,中国长春吉林大学的研究人员开发了一种高灵敏度、快速且准确的方法,用于分析大鼠脊髓组织中的神经递质(NTs)。该方法结合了超声辅助磁离子液体分散液-液微萃取(UA-MIL-DLLM......

1月1日起将实施一批国家标准

2025年1月1日起,汽车对行人的碰撞保护、工业互联网企业网络安全、网络游戏未成年人监护系统、群众性体育赛事活动安全、无障碍洗浴机、社区生鲜店服务规范等一批重要国家标准开始实施,将为引领传统产业优化升......

第六届糖复合物研究前沿网络学术大会顺利举行——探索生命奥秘新途径

为促进我国糖复合物领域的合作交流,加快国内糖科学的发展,由中国生物化学与分子生物学会糖复合物专业分会主办、复旦大学/糖复合物卫健委重点实验室承办、分析测试百科网协办的第六届糖复合物研究前沿网络学术大会......

大小认知错觉?与它有关

俗话说,眼见不一定为实。两个同样大小的圆形,位于大圆中间时看上去会较小,而位于小圆中间时看上去则会较大。这就像“筷子里面拔旗杆”,是经典的“艾宾浩斯错觉”。因此,人类的大小知觉并不总是对物理世界的客观......

一项研究揭示了狗抖湿毛的神经科学原理

当一只狗抖掉毛上的水时,它的动作不是随机的一阵乱舞,也不是故意把站在旁边的人弄湿。事实上,许多毛茸茸的哺乳动物包括鼠、猫、狮、虎和熊等,都有这种本能反射,表现为头部和上半身的快速振动。这一行为有助于动......

上海网络市场监管促发展保安全专项行动显成效

今年以来,上海市市场监管局根据市场监管总局统一部署,组织开展网络市场监管促发展保安全专项行动,聚焦社会关注度高、涉及面广、群众反映强烈的网络突出问题,严格依法依规查处网络违法经营行为,努力营造风清气正......

人体分子图谱“化身”科研网络工具

卡塔尔威尔康奈尔医学院科学家通过分析391名志愿者的血液、尿液和唾液样本中的数千种分子,绘制出人体及其复杂生理过程的分子图。这些数据被整合成一个强大的交互式可视化网络工具,名为“连接组学”。这一工具有......

网络暴力退退退!这个规定今起施行

今天(8月1日)起,《网络暴力信息治理规定》开始施行,《规定》明确,网络信息服务提供者应当在国家网信部门和国务院有关部门指导下细化网络暴力信息分类标准规则,建立健全网络暴力信息特征库和典型案例样本库等......