基于机器学习技术的泡沫混凝土抗压强度预测与敏感性分析,以及超参数优化
《CMES - Computer Modeling in Engineering and Sciences》:Prediction and Sensitivity Analysis of Foam Concrete Compressive Strength Based on Machine Learning Techniques with Hyperparameter Optimization
【字体:
大
中
小
】
时间:2025年10月10日
来源:CMES - Computer Modeling in Engineering and Sciences
编辑推荐:
智能电网安全漏洞分类提出基于图嵌入的Vulnerability2Vec框架,将CVE文本描述转化为包含CVE ID和关键词(名词/动词/形容词)的语义图,利用Node2Vec和Skip-gram生成低维向量,结合SVM实现分类。实验表明其准确率最高达80%,优于传统方法如逻辑回归、朴素贝叶斯和随机森林,尤其在处理复杂系统语义异构性和动态威胁方面效果显著。
现代能源系统日益复杂和多样化,特别是在智能电网和分布式能源基础设施中,对智能且可扩展的安全漏洞分类技术的需求愈发迫切。针对这一挑战,本文提出了一种名为Vulnerability2Vec的基于图嵌入的框架,旨在提升对威胁能源系统韧性的安全漏洞的自动化分类能力。Vulnerability2Vec通过将通用漏洞和披露(CVE)文本解释转换为语义图,使节点代表CVE编号和关键术语(名词、动词和形容词),边则捕捉这些术语之间的共现关系。随后,该方法利用随机游走采样和跳过-gram与负采样(SGNS)将语义图嵌入到低维向量空间中。这种方法能够识别传统稀疏向量方法无法捕捉的潜在关系和结构模式。实验结果表明,该分类方法的准确率可达到80%,显著优于现有基线方法。Vulnerability2Vec不仅为漏洞类型分类提供了理论依据,还展示了如何在复杂的软件系统中对漏洞语义进行建模。
随着现代软件系统的复杂性增加,特别是人工智能技术的融合,安全漏洞的形式变得更加多样化和复杂。这些漏洞往往不是孤立存在的,而是以相互关联的现象形式出现,如语义方法和结构化技术。为了应对这种趋势,网络安全研究机构发布大规模漏洞信息以支持标准化的风险评估和缓解工作。例如,国家漏洞数据库(NVD)每天新增超过40个条目,这反映了当前威胁环境的动态性和高维度特性。这些趋势强调了在复杂能源领域建立智能分类框架的紧迫性。能源系统包括紧密耦合的软件、硬件和通信协议组件。传统的漏洞分类方法通常无法充分捕捉这种复杂性,因此在复杂系统中建立有效的分类技术至关重要。
通用漏洞和披露(CVE)以及通用弱点枚举(CWE)是MITRE管理的网络安全标准。CVE提供了与系统、软件和网络应用相关的各种信息,而CWE则提供了一个关于通用软件弱点类型的正式分类体系。然而,CVE条目缺乏明确的分类模式,使其不适合需要语义分类的任务。NVD通过为CVE条目添加结构化元数据,增强了CVE信息的全面性和可利用性,从而支持更深入的影响分析和风险评估。尽管CVE和CWE是互补的,但由于CVE描述的非结构化特性,CWE映射往往不完整,这使得自动分类变得困难。
虽然CVE和CWE在功能上相辅相成,但它们之间结构上的不匹配限制了自动分类的效率。由于CVE描述缺乏结构化,而CWE映射常常不完整,因此构建可扩展且可解释的威胁检测架构变得极具挑战性,尤其是在智能能源系统和网络物理系统等复杂领域。随着漏洞数据在数量和复杂性上的不断增长,需要新的表示模型来捕捉语义结构,从而为基于深度学习和分数建模的图方法铺平道路。
近年来,云计算和人工智能技术的进步使得跨平台的信息管理需求显著增加。这种扩展带来了更加复杂和多面的攻击模式,挑战了基于预定义类别的传统分类系统。如图1所示,CVE报告的数量和类型在逐年上升,表明这些漏洞尚未被现有软件完全涵盖。图2显示,CWE的年增长率平均约为27%(从1999年到2017年)。现代攻击通常依赖于逻辑错误、应用编程接口(API)或上下文行为的微妙滥用,这使得仅依靠结构特征难以识别。因此,基于语义上下文对漏洞进行分类至关重要,尤其是在复杂且动态的领域,如能源系统。这种扩展引入了日益严重的语义异质性和类别不平衡问题,使得构建结构化映射框架成为必要,以将新兴威胁与其对应的软件弱点进行对齐。
由于CVE数据缺乏对攻击模式的显式表示,通常需要依赖专家的上下文安全知识来判断其实际影响。攻击模式的枚举和分类(CAPEC)提供了关于如何利用安全漏洞的攻击模式信息。虽然直接将CVE与CAPEC关联仍然具有挑战性,但可以通过将它们与CWE定义的软件安全弱点进行关联来实现。CWE分类系统能够系统地组织多样化的漏洞信息,从而支持准确的风险评估和有效的缓解策略。然而,类别不平衡问题仍然是一个根本性限制,影响了对罕见CWE类别的有效建模。
传统的漏洞分类方法通常依赖于由领域专家从各种组件中提取的信息,包括系统级属性和软件规范。尽管这些方法耗时,但由于专家主观判断,它们可能导致错误和一致性问题。因此,网络安全防御的关键在于对不断增加的信息进行动态管理,并通过分析替代专家角色的方法提高效率。
CVE描述在CWE分类中起着关键作用,因为它们通常包含定义每个漏洞最重要的属性。这有助于识别漏洞的条件,从而支持对网络攻击的缓解和有效响应策略的制定。传统的自动分类方法主要依赖于从CVE文本中提取的术语频率分析。早期的神经网络方法采用独热编码来表示特征为稀疏向量。然而,稀疏向量表示——其特点是激活的术语数量有限——在相同术语出现在不同上下文中时,难以捕捉语义差异。此外,这种表示方式在识别新兴漏洞类型时也显得不足,因为关键技术术语或新模式的频率较低。同时,像稀疏编码和哈希技巧这样的方法虽然提高了计算效率和关键特征提取,但在捕捉上下文变化方面仅限于有限程度。
基于图的表示学习已成为在复杂领域建模结构关系的强大范式。与稀疏向量表示不同,基于图的方法非常适合建模语义和句法关系。图可以将各种数据类型,如文本、图像和实体,抽象为节点和边。这有效地捕捉了局部和全局拓扑依赖关系。传统的漏洞检测方法(如基于图嵌入的稀疏向量表示、基于源代码的图方法)在捕捉CVE描述中的潜在语义结构方面存在困难。当没有源代码或基于文本的语义关系时,这种限制尤为明显。基于图嵌入的方法能够捕捉漏洞描述中关键部分的语义关系。通过在全局语义上下文中建模局部术语之间的共现关系,该方法有效地编码了不同类型的漏洞之间的相互依赖关系。
基于图嵌入的方法已被成功应用于多个领域,包括社交网络、生物系统和推荐系统。图嵌入将关系结构转换为低维向量空间,同时保留实体之间的连接性和接近性信息。在软件漏洞分析领域,图神经网络(GNNs)展示了通过抽象语法树(ASTs)和控制流图(CFGs)等结构建模源代码的潜力。虽然这些方法在捕捉句法结构方面有效,但在泛化到具有潜在语义细微差别和上下文依赖行为的漏洞类型时存在局限。
本文提出Vulnerability2Vec,以解决从CVE描述文本中提取的稀疏向量表示所固有的挑战。该方法不仅具有结构复杂性,还具有语义多样性。首先,Vulnerability2Vec通过学习节点之间的连接和结构模式来捕捉上下文关系。该方法包括构建一个图,以建模漏洞描述中的语义关系,然后使用传统的机器学习图嵌入模型对图进行分类。这一过程将具有高语义相似性的元素放置在相邻空间中。其次,我们通过分析基于结构信息的节点相似性来进行自动漏洞分类。这一过程能够识别相关漏洞和攻击技术,揭示网络中的隐藏模式。该方法通过语义驱动的图构建有效地捕捉了上下文信息,而无需依赖基于深度学习的图神经网络的表示复杂性。我们的贡献包括:(1)提出了一种统一的多关系图,集成了源代码和图组件;(2)在扩展CWE类别和漏洞类型的情况下,我们的方法优于六种基线模型;(3)实验结果证明了图表示和节点嵌入过程的有效性。
本研究的其余部分组织如下。第2节回顾了安全漏洞和图嵌入领域的相关工作。第3节描述了所提出的方法。第4节介绍了实验设计和结果,并讨论了研究问题。最后,第5节总结了本文。在准备本文时,作者利用了OpenAI的ChatGPT版本GPT-4o来提高其语言清晰度和语法。作者已仔细审查和修改了输出,并对所有内容承担全部责任。
在本文中,我们提出了Vulnerability2Vec,这是一种基于图嵌入的方法,旨在解决传统稀疏向量表示在安全漏洞分类中的不足。该方法通过将CVE描述转换为语义图,使得节点表示CVE ID和关键术语(名词、动词和形容词),边则捕捉这些术语之间的共现关系。通过结合随机游走采样和跳过-gram与负采样(SGNS)模型,Vulnerability2Vec将语义图嵌入到低维向量空间中,从而实现漏洞分类。这种方法能够识别传统稀疏向量方法无法捕捉的潜在关系和结构模式。实验结果表明,该方法的分类准确率可达80%,显著优于基线方法。Vulnerability2Vec不仅为漏洞类型分类提供了理论基础,还展示了如何在复杂的软件系统中对漏洞语义进行建模。
尽管Vulnerability2Vec在分类性能上表现出色,但该模型仍存在两个核心限制。首先,它依赖于静态的图表示,将漏洞信息嵌入到固定且时间不变的结构中,每当出现新的CVE时,都必须重新构建图,从而限制了其可扩展性。其次,所有嵌入都是在离线批量模式下生成的,这限制了模型在实时处理和连续安全监控中的应用。未来的工作可能集中在通过增加其他模式,如抽象语法树、控制流图和CVSS指标,来丰富图的结构。使用多模态联合嵌入或门控机制可以扩大语义覆盖范围,增强分类的鲁棒性。对于节点嵌入方法,可以考虑使用基于图注意力的方法或深度神经网络,以提高分类的准确性和效率。此外,使用高效的图挖掘或动态图神经网络可以实现增量更新,而连续学习技术可以避免灾难性遗忘。在未来,我们的模型可以应用于实际场景,如实时漏洞监控和自动化补丁优先级管理。我们计划开发一种基于Vulnerability2Vec的工具,以实时分类新漏洞,从而构建更高效的网络安全管理机制。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号