基于人工智能的恶意软件检测与分类算法

首页今日动态人才市场新技术专栏中国科学人云展台
BioHot
云讲堂直播会展中心特价专栏技术快讯免费试用

生物通官微
陪你抓住生命科技
跳动的脉搏

生物通首页 > 今日动态 > 正文

基于人工智能的恶意软件检测与分类算法

《Cybernetics and Intelligence》：AI-Based Malware Detection and Classification Algorithms

【字体：大中小】 时间：2026年06月10日 来源：Cybernetics and Intelligence

编辑推荐：

　　摘要：恶意软件表现出变体快速演化、混淆技术复杂以及零日攻击频发等特征。现有检测方法存在特征提取不足、泛化能力较弱以及难以捕获代码语义信息等问题。本文提出一种基于图神经网络（GNN）与注意力机制融合的恶意软件检测与分类算法。首先，本文将恶意软件的控制流图（CFG

摘要：恶意软件表现出变体快速演化、混淆技术复杂以及零日攻击频发等特征。现有检测方法存在特征提取不足、泛化能力较弱以及难以捕获代码语义信息等问题。本文提出一种基于图神经网络（GNN）与注意力机制融合的恶意软件检测与分类算法。首先，本文将恶意软件的控制流图（CFG）和函数调用图（FCG）转换为异构图结构，并提取节点与边特征。其次，采用图卷积网络（GCN）进行多层特征聚合，并引入多头注意力机制以自适应学习关键代码片段的权重。随后，通过图池化层实现降维并融合全局特征，利用全连接层完成恶意软件的二分类检测与多类别家族识别。最后，引入对抗训练以增强模型鲁棒性。在包含15000个样本的公开数据集上验证结果表明，整体检测准确率达到98.7%，召回率达到98.8%，对混淆样本的检测率提升至96.1%。实验结果表明，该方法能够有效识别恶意软件变体，具有较强的实际应用价值。

该论文发表于《Cybernetics and Intelligence》，围绕恶意软件检测在复杂对抗环境下面临的语义建模不足与鲁棒性不强等核心瓶颈展开。研究背景在于，传统基于特征码匹配的检测技术面对混淆变换、多态引擎、代码虚拟化等对抗手段时效果明显下降；静态分析难以处理加壳与反调试技术，动态沙箱分析又容易被环境感知机制规避。即使机器学习方法提高了检测自动化水平，许多方法仍依赖人工设计特征，难以充分表达恶意代码的深层语义关系与执行逻辑。已有深度学习方法虽然被引入该领域，但常把二进制文件视为字节序列或图像进行处理，忽略了程序天然具有的图结构属性、控制流依赖以及函数调用关系。因此，如何构建兼顾结构信息、行为语义和抗混淆能力的检测框架，成为开展这项研究的直接动因。

针对上述问题，研究人员提出了一种融合图神经网络（GNN，能够在图结构数据上传播和聚合信息的神经网络）与多头注意力机制的端到端恶意软件检测与分类框架。该方法以控制流图（CFG，描述程序基本块及其控制转移关系）和函数调用图（FCG，描述函数间调用依赖关系）为基础，构建恶意软件异构图表示，同时结合图卷积网络（GCN，一类通过邻域聚合学习节点表示的图神经网络）提取深层结构语义特征，再通过多头注意力机制突出关键恶意行为片段，最后以图池化和全连接分类器实现良性/恶性二分类及恶意软件家族多分类识别，并利用对抗训练提升对混淆和变形样本的鲁棒性。研究结论表明，该框架在公开数据集上显著优于传统静态特征方法与现有深度学习基线，在检测性能、家族识别能力、抗混淆能力和推理效率之间取得了较好平衡，说明基于图结构表示的语义建模与注意力加权对于恶意代码分析具有重要意义。

从技术方法看，研究人员主要采用了以下几类关键方法。其一，基于IDA Pro 7.5、Radare2和Ghidra对样本进行静态分析，样本来自Kaggle Malware Classification Challenge数据集与VirusShare平台，共15000个Windows可执行文件，据此提取CFG、API调用序列、系统调用与函数依赖关系。其二，将CFG与FCG融合为异构图，并构建256维节点特征，包含指令类型嵌入、操作码频率、寄存器使用和常量分布。其三，使用四层GCN进行特征传播，嵌入8头注意力模块与TopK图池化提取全局图表示。其四，采用联合损失函数实现二分类与家族分类，并使用快速梯度符号法（FGSM）开展对抗训练，提高模型抗混淆鲁棒性。

在研究结果部分，论文首先在“3.1 Construction of Malicious Software Graph Representation”中说明了恶意软件图表示的构建方式。研究人员通过遍历可执行文件的`.text`段提取完整CFG，以基本块作为节点，以顺序执行、条件跳转、无条件跳转和函数调用作为边类型，并进一步解析函数调用关系构建FCG。随后将两类图融合为异构图，以邻接矩阵和特征矩阵作为后续模型输入。节点特征由指令类型、操作码频率、寄存器使用及常量编码共同组成，表示为256维向量；边权重则综合条件跳转概率与执行频率进行定义。论文指出，对于包含1247个基本块和83个函数的恶意样本，最终生成的异构图包含1330个节点与2156条边。这一部分的核心结论是：通过融合CFG与FCG，可以同时表征函数内部控制语义与函数间依赖关系，从而为恶意行为模式识别提供更完整的结构基础。

在“3.2 Feature Aggregation Based on GCN”部分，研究人员提出以四层堆叠式GCN对恶意软件异构图进行特征聚合。每层通过对邻域节点特征进行归一化加权聚合来更新当前节点表示，隐藏层维度依次设为256、512、512和256，并采用Leaky ReLU、Batch Normalization、Dropout和DropEdge等策略增强训练稳定性与泛化能力。论文比较了不同层数配置后指出，四层结构在性能与效率之间达到最优平衡，而五层网络会因过平滑（over-smoothing，节点表示逐渐趋同而失去判别性）导致准确率下降1.6%。这一结果说明，多层图卷积能够有效捕获多跳结构依赖，但网络深度必须受到控制，以避免图表示退化。

在“3.3 Multi Head Attention Mechanism Design”部分，论文将8头多头注意力模块嵌入第三层与第四层GCN之间。各注意力头通过查询（query）、键（key）和值（value）变换，独立建模节点间相关性，并使用缩放点积注意力计算邻域权重。研究结果显示，包含恶意行为的API调用序列节点通常具有更高注意力得分，而普通控制流节点的平均权重较低。不同注意力头分别偏向数据流依赖、控制流跳转模式和函数调用层级等不同语义子空间。研究人员据此认为，多头注意力机制能够自动定位诸如加密函数、权限提升操作和网络通信等关键恶意代码片段，并通过残差连接、层归一化和注意力Dropout进一步提升模型表现。这一部分的主要结论是：注意力机制有效增强了模型对行为关键节点和边的识别能力，提升了语义解释性与判别性。

在“3.4 Classification and Adversarial Training”部分，研究人员设计了基于自适应TopK的图池化层，从图中保留得分最高的30%关键节点，再通过全局平均池化与全局最大池化拼接得到512维图级表示。分类阶段使用三层全连接网络分别完成恶意软件二分类与9类家族识别。针对样本不平衡问题，二分类使用加权交叉熵损失，多分类使用Focal Loss，并通过联合损失函数平衡两任务。与此同时，论文采用FGSM在节点特征空间中添加扰动，构造对抗样本，扰动幅度?逐步从0.01增长至0.05，每批次中对抗样本占40%。文中强调，对抗扰动仅作用于节点特征，不改变CFG和FCG拓扑，因此能够在保持程序图结构有效性的前提下评估模型鲁棒性。这一部分表明，多任务学习与对抗训练相结合，使模型既能提升家族区分能力，又能增强对代码混淆与变形的抗干扰能力。

在“4.1 Experimental Setup”部分，研究人员介绍了实验数据与设置。数据集由11780个恶意样本和3220个良性样本组成，覆盖Zeus、Emotet、Ransomware、Trojan、Backdoor等9个主流家族。预处理阶段过滤节点数少于50或多于2000的图，以减少噪声并避免计算不稳定。数据按照7:2:1划分为训练集、验证集和测试集。对照方法包括基于静态特征的Random Forest和基于原始字节序列的MalConv。此部分表明，实验设计围绕检测性能、家族分类能力与鲁棒性进行了系统评估，并提供了较明确的硬件和超参数设置基础。

在“4.2 Performance Evaluation of Detection”部分，研究人员在1500个测试样本上比较了所提方法与两种基线。结果显示，该方法总体准确率达到98.7%，高于Random Forest的91.2%和MalConv的94.7%；召回率达到98.8%，也显著优于两种对照方法；F1值达到98.2%，显示出较强的综合检测性能。对于不同恶意软件家族，该方法在Backdoor检测上取得99.0%的F1值，在Trojan检测上也达到97.0%。论文据此得出结论：相较于依赖静态人工特征或局部字节模式的方法，基于图结构和注意力融合的模型更能捕获复杂恶意代码的深层语义关系，从而降低漏检和误检。

在“4.3 Family Classification and Robustness Analysis”部分，研究人员使用指令替换、死代码插入、控制流平坦化、函数内联等混淆手段构造了800个混淆样本，并划分为30%、60%和90%三种混淆强度。结果表明，所提方法对混淆样本的综合检测率达到96.1%，在90%严重混淆条件下，对各家族仍保持92.8%—94.7%的鲁棒性；相比之下，Random Forest下降到70.3%—74.9%，MalConv下降到81.2%—84.7%。其中，Emotet在严重混淆下最难检测，但所提方法仍保持94.7%的鲁棒性。此部分说明，图结构表示保留了恶意代码在混淆前后较稳定的行为模式，因此在复杂对抗场景下具有更强的抗干扰能力。

在“4.4 Ablation Experiment and Visualization”部分，论文通过消融实验评估各模块贡献。仅用四层GCN的基础模型二分类准确率为94.2%，多分类F1值为89.6%，混淆样本检测率为87.3%。加入多头注意力后，准确率提升至96.8%，多分类F1值升至93.4%，混淆样本检测率提高至91.7%，说明注意力机制对关键恶意行为建模具有直接贡献。进一步加入残差连接后准确率达到97.3%；引入对抗训练后混淆样本检测率提升至94.8%，带来最显著的鲁棒性增益；图池化进一步改善全局特征提取；最终结合联合损失函数后，完整模型达到98.7%的二分类准确率、96.3%的多分类F1值和96.1%的混淆样本检测率。参数量从2.1M增加到3.8M，而推理时间仅增加0.05秒。可视化分析还表明，不同注意力头分别关注加密、网络通信和注册表修改等不同行为语义。该部分结论是，各个模块均对模型性能有可验证的正向贡献，其中对抗训练与多头注意力尤为关键。

从讨论部分来看，论文反复强调现有方法对程序结构信息利用不足，而所提出的异构图建模、图卷积语义聚合和注意力加权机制，能够更充分地表达控制流与函数依赖之间的复杂交互关系。研究同时指出，该模型在大规模控制流图场景下仍存在较高计算成本，未来需要优化图采样策略，并可进一步探索静态结构信息与动态运行行为的联合建模、图神经网络结构自动搜索以及小样本学习方法，以提高对新型恶意软件家族的快速识别能力。

研究结论部分可概括翻译如下：本文提出了一种融合图神经网络与多头注意力机制的恶意软件检测与分类方法，用于解决恶意软件检测中存在的特征表示不足和鲁棒性不强问题。通过将控制流图（CFG）与函数调用图（FCG）建模为异构图结构，利用图卷积网络（GCN）进行深层语义特征聚合，并结合多头注意力机制自适应定位恶意行为关键片段，实现了对复杂恶意软件的精准识别。对抗训练策略的引入使模型对代码混淆、指令替换等变换技术具有较强抵抗能力。图池化与联合损失函数设计满足了二分类检测和多类别家族识别的双重需求。公开数据集验证表明，该方法在检测性能、鲁棒性和推理效率方面均优于传统静态分析方法和现有深度学习方法，体现出图结构表示与注意力机制在恶意代码分析领域的有效性。同时，论文也指出，在处理大规模控制流图时模型计算开销仍然较高，后续仍需在图采样和多模态联合建模方面继续优化。

联系信箱：

粤ICP备09063491号

热点排行