-
一种针对延迟和隐私敏感任务的差分进化卸载策略,采用联邦式本地边缘-云协作模式
摘要由于移动设备的快速增长以及无线通信技术的迅速发展,本地-边缘-云计算正成为一种有吸引力的解决方案,它通过利用移动设备、边缘服务器和云的多计算能力来提供更高质量的服务。然而,由于任务对延迟和隐私非常敏感,在本地-边缘-云计算系统中实现高度可靠的任务卸载成为一个关键问题。在本文中,我们研究了分层式本地-边缘-云计算网络中针对对延迟和隐私敏感的任务的计算卸载问题,并采用了联邦学习方法。我们的目标是在不影响数据隐私的情况下,最小化移动设备请求的延迟敏感任务的执行时间,同时每个任务都可以在本地、边缘或云计算模式下执行,而无需依赖隐私数据。首先,我们建立系统模型来分析不同计算模式下的延迟情况,然后提出
来源:ACM Transactions on Sensor Networks
时间:2025-11-08
-
整合多种软件工件以提升基于大语言模型的错误定位和程序修复效果
摘要大型语言模型(LLMs)因其在自动化程序修复(APR)方面的潜力而受到了广泛关注。基于LLM的方法可以通过填充式技术插入正确的代码,或者在提供有缺陷的方法时直接生成补丁,目标是生成能够通过所有测试的合理补丁。然而,大多数基于LLM的APR方法仅依赖一种类型的软件信息,例如问题描述或错误堆栈跟踪,而没有充分利用多种软件工件的组合。相比之下,人类开发者通常会使用多种信息(如调试数据、问题讨论和错误堆栈跟踪)来诊断和修复错误。尽管如此,许多基于LLM的方法并未探索哪种特定类型的软件信息最有助于定位和修复软件错误。解决这一差距对于推进基于LLM的APR技术至关重要。为了研究这一问题并模仿人类开发者
来源:ACM Transactions on Software Engineering and Methodology
时间:2025-11-08
-
基于大语言模型的代码生成研究:针对资源匮乏和特定领域编程语言的应用
摘要大型语言模型(LLMs)在流行编程语言的代码生成方面展现出了显著的能力。然而,它们在低资源编程语言(LRPLs)和领域特定语言(DSLs)上的表现仍是一个关键挑战。这一差距影响了数百万开发者——仅Rust就有350万用户——他们目前无法充分利用LLMs的功能。LRPLs和DSLs面临独特的挑战,包括严重的数据稀缺问题,以及DSLs高度专业化的语法和语义在通用数据集中表现不佳的问题。解决这些挑战至关重要,因为LRPLs和DSLs能够显著提高特定领域和应用(包括金融和科学工作)的开发效率。尽管已有许多关于LLMs在软件工程和代码生成方面的研究,但没有一项研究全面探讨了LRPLs和DSLs所面临
来源:ACM Transactions on Software Engineering and Methodology
时间:2025-11-08
-
重新思考代码相似性:一种基于逻辑的框架,用于超越函数等价的跨语言分析
摘要跨语言代码剽窃和漏洞传播对软件完整性构成了严重威胁,因此需要采用先进的代码相似性分析方法。传统方法主要关注功能等价性,往往忽略了更深层次的结构和算法相似性。因此,这些方法常常仅基于功能对齐就将代码片段错误地归类为相似,尽管它们在底层逻辑或算法实现上存在显著差异。为了解决这一关键问题,我们提出了SimCL,这是一种新颖的基于逻辑的跨语言代码相似性分析框架。SimCL的核心创新在于使用统一的控制流图(uCFG)表示法,该表示法源自新引入的与语言无关的统一中间表示(uIR)。这种统一的方法有助于准确识别不同编程语言之间的逻辑相似性,超越了语法和表面功能上的相似性。此外,我们还引入了SimGK,这
来源:ACM Transactions on Software Engineering and Methodology
时间:2025-11-08
-
LLM与ML的结合:在不稳定日志上进行的数据高效异常检测
摘要大多数基于日志的异常检测器假设日志是稳定的,但实际上由于软件或环境的变化,日志往往是不稳定的。因此,在不稳定的日志上进行异常检测(ULAD)是一个更为现实但研究不足的挑战。目前的方法主要采用机器学习(ML)模型,这些模型通常需要大量的标记数据进行训练。为了缓解数据不足的问题,我们提出了FlexLog,这是一种新颖的混合方法,它将ML模型(决策树、k最近邻和前馈神经网络)与大型语言模型(Mistral)通过集成学习相结合。FlexLog还引入了缓存和检索增强生成(RAG)技术,以进一步提高效率和效果。为了评估FlexLog,我们准备了四个用于ULAD的数据集,分别是ADFA-U、LOGEVO
来源:ACM Transactions on Software Engineering and Methodology
时间:2025-11-08
-
用于智能城市中人群计数和定位的Scale Attentive Aggregation Network(缩放注意力聚合网络)
摘要近年来,智能城市中的应用得到了显著的发展。人群分析是一个关键的研究领域,它包含两个子任务:人群计数和人群定位。然而,由于存在一些不利的内在因素(如尺度变化和背景噪声),这些因素严重影响了人群计数和定位的准确性。尽管在人群计数和定位的单独研究上已经付出了大量努力,但很少有研究能够同时完成这两项任务。为此,提出了尺度敏感的聚合网络(SA2Net),以同步解决人群计数和定位任务中的尺度变化和背景噪声问题。SA2Net包含两个核心模块:多尺度特征聚合器(MFA)模块和背景噪声抑制器(BNS)模块。MFA模块采用四路径结构,用于聚合多尺度特征,以促进不同尺度之间的关联;BNS模块利用输入关键矩阵与自
来源:ACM Transactions on Sensor Networks
时间:2025-11-08
-
探索信任领域的边界:大型语言模型在软件工程中的应用——见解与视角
摘要大型语言模型(LLMs)在软件工程(SE)中的应用在业界和学术界持续快速增长。随着这些模型成为关键SE流程的重要组成部分,确保其可靠性和可信度变得至关重要。实现这一目标需要一种平衡的信任机制:过度的信任可能会引入安全漏洞,而信任不足则可能阻碍创新。然而,关于LLMs在SE中的信任机制(LLM4SE)的概念框架仍然不明确。诸如信任、不信任和可信度等关键概念缺乏精确定义,影响信任形成的因素尚未得到充分研究,用于评估LLMs信任度的指标也尚未建立。为了梳理当前的研究现状并确定未来的研究方向,我们对88篇相关文章进行了全面回顾;同时系统性地分析了18篇关于LLMs在SE中的研究,并参考了70篇来自
来源:ACM Transactions on Software Engineering and Methodology
时间:2025-11-08
-
在数字孪生辅助的车联网中,针对任务卸载的能源-延迟联合优化
摘要车辆边缘计算(Vehicle Edge Computing, VEC)通过将任务卸载到边缘服务器上来为车辆提供高效的服务。现有研究主要采用深度学习和强化学习等方法来做出资源分配决策,但未能充分考虑车辆的高速度移动性以及车联网(Internet of Vehicles, IoV)的动态特性对决策过程的影响。本文提出了一种新概念——基于数字孪生的车联网(digital twin-assisted IoV),以解决上述问题。其中,车联网的数字孪生可以为计算任务卸载和内容缓存决策提供训练数据,使边缘服务器能够实时捕捉环境的动态变化并与之交互。通过这种协作方式,智能边缘服务器可以迅速响应车辆请求并返
来源:ACM Transactions on Sensor Networks
时间:2025-11-08
-
HDM-GNN:一种用于犯罪预测的异构动态多视图图神经网络
摘要近年来,智能城市引起了广泛关注。这些城市利用物联网(IoT)支持的传感器从各种来源收集数据,从而在多个领域(如公共安全)提升居民的生活质量。准确的犯罪预测对于提升公共安全至关重要。然而,复杂的时空依赖性使得这一任务变得极具挑战性,原因主要有两个方面:1)犯罪的时空依赖性不仅体现在与相邻区域的相关性上,还体现在与遥远区域之间的潜在关联上,例如人员流动的连通性和功能相似性;2)犯罪事件在时间上存在短周期重复和长周期变化的趋势。大多数现有研究在处理多视角相关性时存在不足,因为它们通常将所有相关性同等对待,而没有考虑这些相关性之间的差异。在本文中,我们提出了一种名为“异构动态多视角图神经网络”(H
来源:ACM Transactions on Sensor Networks
时间:2025-11-08
-
微服务的自动规则检查:通过可解释性支持安全分析
摘要软件安全分析通常需要手动完成,这会导致性能和准确性方面的问题。引入自动化是一个挑战,因为往往需要对分析结果进行人工验证,尤其是在安全评估和认证过程中。微服务应用程序的分布式特性进一步加剧了这些问题。我们提出了一种自动检查微服务应用程序模型中架构安全规则的方法。该方法能够为以模型查询形式表达的规则提供可解释性。这种易于理解的、逐步进行的验证过程利用了输入模型中的可追溯性信息,将结果与代码中的实际组件关联起来。因此,可以从源代码到模型,再到规则结果的整个分析过程都可以被追踪和验证。除了预定义的25条最佳实践架构安全规则外,用户还可以自定义规则。我们通过使用一个原型(称为MicroCertiSe
来源:ACM Transactions on Software Engineering and Methodology
时间:2025-11-08
-
针对性深度学习系统边界测试
摘要评估深度学习(DL)系统的行为边界对于理解其在各种未见输入下的可靠性至关重要。现有的解决方案存在不足,因为它们依赖于无针对性的随机扰动,且对输入变化的控制有限。在这项工作中,我们引入了Mimicry,这是一种新型的黑盒测试生成器,用于对DL系统的边界进行细粒度、有针对性的探索。Mimicry通过利用DL输出的概率特性来识别有潜力的探索方向来进行边界测试。通过使用基于风格的GAN将输入分解为内容和风格两部分,Mimicry通过模仿源类和目标类的特征来生成边界测试输入。我们评估了Mimicry在为五种DL图像分类系统生成边界输入方面的有效性,并将其与文献中的两个基线进行了比较。结果显示,Mim
来源:ACM Transactions on Software Engineering and Methodology
时间:2025-11-08
-
通过行为模型增强的大型语言模型代理对虚拟个人助理(VPA)应用程序进行视觉用户界面(VUI)测试
摘要随着智能音箱的日益普及,虚拟个人助手(VPA)应用程序已成为日常生活中不可或缺的一部分,用户可以通过语音用户界面(VUI)获取新闻、娱乐内容并控制智能设备。然而,许多VPA应用程序存在质量问题,例如突然终止或无法处理常见的用户指令,这凸显了进行系统化且高效VUI测试的迫切需求。现有的聊天机器人风格和基于模型的测试方法缺乏全局性和语义理解能力,导致测试用例生成效果不佳,状态探索效率低下。为了解决这些问题,我们提出了Elevate,这是一个基于大型语言模型(LLM)的VPA测试框架,该框架采用了多智能体架构来提升VUI行为测试的效果。Elevate包含三个专门的LLM智能体——观察者(Obse
来源:ACM Transactions on Software Engineering and Methodology
时间:2025-11-08
-
PnA:针对边缘智能联邦学习的抗 poisoning 攻击的鲁棒聚合机制
摘要联邦学习(FL)在智能城市的边缘智能应用中具有巨大潜力,它允许智能设备通过交换本地模型更新来协作训练全局模型,而不是共享本地训练数据。然而,恶意客户端可能通过实施“投毒攻击”来破坏全局模型,导致全局模型无法收敛、测试集预测结果错误或系统被植入后门。尽管某些聚合算法可以提高FL对恶意攻击的鲁棒性,但我们的研究表明,现有的隐蔽式投毒攻击仍能绕过这些防御机制。在这项工作中,我们提出了一种名为“Parts and All”(简称PnA)的鲁棒聚合机制,通过在检测到投毒攻击时过滤掉恶意本地模型更新来保护FL的全局模型。我们在三个具有代表性的数据集上进行了全面实验。实验结果表明,与现有的鲁棒聚合算法相
来源:ACM Transactions on Sensor Networks
时间:2025-11-08
-
RunTyper:利用动态分析提升Python的深度类型推断能力
摘要像Python这样的动态语言因其提供的灵活性而备受重视,这主要归功于它们的动态类型系统。然而,这种灵活性往往伴随着代价:与类型相关的错误通常只在运行时才会显现出来,这可能导致难以定位的错误。这种情况凸显了有效自动类型推断策略的迫切需求。最近,在基于深度学习的方法开发方面取得了显著进展,这些方法旨在解决这些问题。尽管这些方法具有潜力,但在处理罕见类型(主要是Python中的用户定义类型)时却面临相当大的限制,因为这些类型在训练数据集中的代表性往往不足。为了解决Python中动态特性的固有不可预测性问题,我们提出了一个名为RunTyper的创新框架。RunTyper独特地将动态分析与一个结合了
来源:ACM Transactions on Software Engineering and Methodology
时间:2025-11-08
-
基于需求的测试生成:一项全面综述
摘要作为确保软件质量的重要手段,软件测试通过生成和执行测试用例来识别软件缺陷。已经提出了许多策略来指导测试用例的生成,例如基于源代码的方法和基于错误报告的方法。基于需求的测试生成(RBTG)根据指定的需求构建测试用例,从而与用户需求和期望保持一致,而无需访问源代码。自1994年引入以来,RBTG的发展取得了许多进展,包括各种方法、实现方式、工具、评估和评价方法以及应用场景。本文对RBTG进行了全面综述,对需求类型进行了分类,探讨了测试用例的类型,总结了现有的工具,并分析了实验评估结果。此外,本文还总结了RBTG的应用领域和工业应用,并讨论了一些未解决的研究挑战和潜在的未来研究方向。
来源:ACM Transactions on Software Engineering and Methodology
时间:2025-11-08
-
通过联邦评估机制实现自适应加权,以适应带有边缘设备的领域自适应
摘要联邦学习是智能城市中边缘计算的一种新兴应用范式。一方面,它能够高效、私密且安全地处理敏感数据;另一方面,它减轻了智能城市对集中式数据处理的依赖。然而,在实际应用中,由于领域适应导致的性能下降已成为限制联邦学习广泛应用的瓶颈。大多数现有方法通过设计新的本地学习方法来解决这一问题,以在不同领域之间传递知识,但忽略了全局模型聚合的优化。为了解决这个问题,我们提出了一种新的方法,该方法利用无标签对抗学习技术来评估在不同领域下全局模型学习到的表示。在联邦学习的约束条件下,我们通过将每个领域的分布与全局分布对齐来最小化差异。此外,我们还开发了一种快速检测器来提高生成图像的质量。通过在图像分类任务上的大
来源:ACM Transactions on Sensor Networks
时间:2025-11-08
-
在端边云系统中,通过自监督特征映射实现隐私感知的卸载策略
摘要在物联网(IoT)时代,大量终端设备的广泛应用对数据处理提出了前所未有的需求。为应对这一挑战,端边云系统应运而生,其中任务卸载在高效分配计算资源方面发挥着关键作用。与此同时,随着人们对隐私问题的关注度不断提高,隐私意识强的任务卸载方法也受到了广泛关注。然而,现有的隐私意识强任务卸载方法存在诸多局限性,例如仅适用于特定场景、卸载策略的传输能力较弱等。本文研究了端边云系统中的隐私意识强任务卸载问题,并提出了一种名为PATO的隐私保护型任务卸载策略。PATO由两个核心模块组成:首先,一个新颖的自监督特征映射模块通过复杂的一向映射方式对敏感信息进行转换;随后,一个基于强化学习(DRL)的决策模块利
来源:ACM Transactions on Sensor Networks
时间:2025-11-08
-
在基于边缘智能的物联网中实现成本效益高的深度神经网络部署
摘要边缘智能(Edge Intelligence, EI)结合了边缘计算和人工智能技术,使服务提供商能够在靠近用户的边缘服务器上部署深度神经网络(Deep Neural Networks, DNNs),从而为智能城市中的普适物联网(Internet of Things, IoT)提供智能应用(例如自动驾驶)。这不仅提升了用户体验(Quality of Experience, QoE),还改善了处理能力和能源效率。然而,由于DNN通常计算量大且资源需求高,传统的部署方法忽略了多维资源需求(如处理器、内存等)的影响,这可能会降低系统的实时性能。此外,随着地理分布式边缘服务器规模的不断扩大,中央决策
来源:ACM Transactions on Sensor Networks
时间:2025-11-08
-
测试Oracle为REST API生成的代码 - RCR报告
摘要本报告《复制计算结果(RCR)》与我们发表在TOSEM期刊上的论文“REST API的测试预言机生成方法”相配套。在这项研究中,我们提出了AGORA+这一黑盒式方法,该方法通过检测不变量(即始终应保持的输出属性)来自动为REST API生成特定领域的测试预言机。作为RCR的一部分,我们提供了一个复制包(可在https://doi.org/10.5281/zenodo.12506791获取),该包能够完整再现我们的实验结果,并为未来的研究奠定基础。
来源:ACM Transactions on Software Engineering and Methodology
时间:2025-11-08
-
在人工智能驱动的边缘计算环境中,针对资源受限设备的支持模型剪枝的联邦分割学习
摘要分布式协同机器学习(DCML)在人工智能支持的边缘计算环境中(如工业物联网(IIoT))得到了广泛应用,用于处理智能设备产生的海量数据。然而,并行DCML框架需要资源受限的设备来更新整个深度神经网络(DNN)模型,并且容易受到重构攻击。与此同时,串行DCML框架由于其串行训练的特性而存在训练效率问题。在本文中,我们提出了一种基于模型剪枝的联邦分裂学习框架(MP-FSL),该框架采用安全高效的训练方案来降低资源消耗。具体而言,MP-FSL通过自适应通道剪枝压缩DNN模型,并将每个压缩后的模型分为两部分,分别分配给客户端和服务器。同时,MP-FSL采用了一种新颖的聚合算法来整合剪枝后的异构模型
来源:ACM Transactions on Sensor Networks
时间:2025-11-08