基于强化学习的脆弱状态导向模糊测试技术VSGFuzz:二进制程序漏洞检测新方法

【字体: 时间:2025年07月22日 来源:Array 2.7

编辑推荐:

  针对二进制程序漏洞检测效率低下的问题,研究人员提出了一种名为VSGFuzz的新型模糊测试技术。该方法通过构建基于图嵌入的漏洞预测模型评估函数脆弱概率(VP),结合强化学习(DDPG算法)优化种子变异策略,设计融合路径权重和HugeScore的种子评分机制。实验表明,VSGFuzz在LAVA-M数据集和真实程序中比现有方法(AFL/VUzzer等)多发现30%以上漏洞,覆盖效率提升40%,为二进制安全分析提供了创新解决方案。

  

在数字化时代,二进制程序作为现代计算的基石,其安全性直接关系到关键基础设施的稳定运行。然而,这些程序往往隐藏着大量未知漏洞,可能引发数据泄露、服务中断等严重后果。传统模糊测试技术虽然能有效发现漏洞,但存在路径覆盖盲目、变异效率低下等痛点——研究表明,Mozilla Firefox中仅有不到5%的源代码文件包含漏洞,这意味着95%的测试资源可能被浪费在无关路径上。

针对这一挑战,研究人员创新性地提出了VSGFuzz(脆弱状态导向模糊测试)技术。该研究首先通过构建属性控制流图(ACFG)对二进制函数进行表征,利用图嵌入网络计算函数脆弱概率(VP∈[0,1]);随后设计基于基本块价值(BV)的种子评分算法,将强化学习(DDPG)与模糊测试相结合,建立包含14种变异动作的马尔可夫决策过程。论文发表在《Array》期刊,展示了该技术在漏洞检测效率上的重大突破。

研究团队采用三项核心技术:1)基于IDA Pro插件的ACFG特征提取器,平均1.8秒完成单个程序分析;2)TensorFlow框架构建的漏洞预测模型,准确率达99.8%;3)深度确定性策略梯度(DDPG)算法,通过Critic-Actor双网络结构优化变异策略。在LAVA-M数据集测试中,VSGFuzz对base64程序发现28个漏洞,显著优于VUzzer的17个;在DARPA CGC二进制测试中,37个程序触发崩溃,比AFLPIN多出60%。

【静态分析与动态分析结合架构】
通过六步工作流实现:数据预处理阶段将二进制函数转化为八维属性向量的ACFG;漏洞预测阶段采用softmax函数输出VP值;基本块价值计算引入路径可达性权重W(bi)=1/pb;动态执行时通过种子评分(SeedScore=ΣBV+C×HugeScore)指导变异方向。

【强化学习模型创新】
构建状态-动作空间时,将输入种子表示为最大长度Lmax的字节数组;设计包含交叉变异(Crossover)等14种操作的行动空间;采用DDPG算法实现策略优化,其中Critic网络损失函数为loss=1/NΣ(yi-Qω(si,ai))2,通过软更新机制(ω′←ξω+(1-ξ)ω′)稳定训练过程。

【实验验证优势】
在真实程序测试中,VSGFuzz对mpg321程序发现425次崩溃,是AFL的22倍;边缘覆盖率在readelf测试达8890,比AFL-Fast提高728%。关键突破在于:1)通过VP值定位5%的高危代码区域;2)DDPG算法将有效变异操作选择率提升30%;3)HugeScore机制使崩溃触发效率提高3倍。

该研究开创性地将程序分析、机器学习和强化学习深度融合,解决了传统模糊测试的三大困境:一是通过ACFG表征突破二进制代码语义理解瓶颈;二是用VP值替代盲目路径覆盖,使测试资源聚焦7.2%的高危函数;三是DDPG算法实现变异策略的自适应优化。这些创新使VSGFuzz成为首个在真实环境中实现漏洞预测-定向变异联动的二进制分析框架,为自动化漏洞挖掘树立了新标杆。未来,该技术可扩展至物联网设备固件分析等领域,对构建主动防御体系具有重要实践价值。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号