
-
生物通官微
陪你抓住生命科技
跳动的脉搏
RAMPAGE框架:算法生成域检测的可重复性保障与性能优化研究
【字体: 大 中 小 】 时间:2025年06月18日 来源:Expert Systems with Applications 7.5
编辑推荐:
为解决恶意软件使用算法生成域(AGD)逃避检测的问题,研究人员开发了RAMPAGE框架,通过标准化训练和比较机器学习模型,提出基于逻辑回归的新模型,在公开数据集上实现96.68%的准确率,为网络安全领域提供了可复现的研究基准。
在网络安全攻防战中,恶意软件通过算法生成域(Algorithmically Generated Domains, AGD)技术动态创建通信域名,使得传统基于静态规则(如IP黑名单)的防御手段失效。尽管已有大量基于深度学习(Deep Learning)的检测方案,但各研究使用的数据集、评估标准不一致,导致模型性能无法横向比较。更棘手的是,许多研究未公开代码或数据,严重阻碍了该领域的可重复性(Reproducibility)研究。
针对这一困境,西班牙萨拉戈萨大学的研究团队开发了RAMPAGE(fRAMework to comPAre aGd dEtectors)软件框架,首次实现了AGD检测模型的标准化训练与比较。该研究创新性地融合7种神经网络(包括LSTM、CNN等)与逻辑回归(Logistic Regression)构建元模型(Meta-model),在包含76种DGA家族的UTL_DGA22数据集上测试显示:准确率达96.68%,F1-score为96.66%,较现有最优模型提升1.2%。相关成果发表于《Expert Systems with Applications》。
关键技术包含:1)构建5个异构数据集(D1
-D5
),其中D4
来自大学DNS服务器真实流量;2)实现17种经典神经网络模型(如Woodbridge LSTM、Berman CNN);3)采用SHAP值(SHapley Additive exPlanations)和消融实验(Ablation Study)解析元模型决策机制;4)通过Scott-Knott ESD检验进行统计验证。
研究结果揭示:
讨论部分指出,RAMPAGE框架通过三种方式推动领域发展:
该研究的核心价值在于破解了AGD检测领域的"可重复性危机",其提出的元模型架构为工业级部署提供了高精度、可解释的解决方案。未来工作需重点解决动态子域(如Google的safeframe.*)引发的误报问题,这需要构建更贴近真实网络环境的训练数据集。
生物通微信公众号
知名企业招聘