生物通-更多新闻

当前位置：首页 > 今日动态 > 科研动态/国外

ByteCue：利用API信息优化字节码注释生成

摘要字节码是一种专为程序解释器高效执行而设计的指令集。与人类可读的源代码不同，字节码对于程序员和研究人员来说更难以理解。字节码被广泛应用于各种软件任务中，包括恶意软件检测和代码克隆检测。为了快速准确地理解字节码的含义，并进一步协助程序员进行这些软件相关工作，我们提出了一种名为ByteCue的字节码注释生成方法，该方法使用了神经语言模型。具体来说，为了获取字节码的结构化信息，我们首先生成字节码的控制流图（CFG），同时解析字节码中调用的API并对其进行序列化。然后，我们提出了一个基于Transformer的模型来学习字节码特征以生成注释。通过从Maven仓库中

来源：ACM Transactions on Software Engineering and Methodology

时间：2025-11-08
APEX：用于低功耗无线协议的自动化参数探索

摘要对网络协议进行精心参数化对于最大化低功耗无线系统的性能以及确保满足严格的应用需求至关重要。这是一项非平凡的任务，需要在对测试平台进行彻底的表征的同时，还需要专家的知识。不幸的是，目前业界仍缺乏一种能够简化参数探索过程同时减少测试平台使用时间的工具。这样的工具将非常宝贵，因为由于测试平台资源有限，穷举式参数搜索可能耗时过长或不可行；而非穷举式的无指导搜索很少能得到满意的结果。在本文中，我们提出了APEX框架，该框架能够实现低功耗无线协议的自动化和有针对性的参数探索，并在有限的测试次数内找到最佳参数组合。我们利用高斯过程来有效处理带有噪声的实验数据，并评估参数组合的最优性。在开发出APEX原型

来源：ACM Transactions on Sensor Networks

时间：2025-11-08
DA-VinCi：一种利用内存计算的深度学习加速器框架

摘要当今深度学习模型所依赖的矩阵运算通常在特定于SIMD领域的加速器中实现[1–19]。包括GPU和阵列处理器在内的SIMD加速器能够有效利用计算密集型模型中的并行性，但对于内存密集型模型而言，其效率可能会降低。人们正在探索基于内存处理（PIM）的架构，以提升这类模型的能效和可扩展性能[20–33]。现代现场可编程门阵列（FPGA）在器件内部分布了数百兆比特的SRAM作为独立的内存资源，这使其成为开发定制的“处理器在内存中”（Processor In/Near Memory）加速器的理想平台。已经提出了多种基于PIM阵列的加速器设计[24–31]，以充分利用这一丰富的内部带宽。然而，迄今为止的

来源：ACM Transactions on Reconfigurable Technology and Systems

时间：2025-11-08
用于构建和优化机器学习工作流程的大型语言模型：综述

摘要机器学习（ML）工作流程——包括数据预处理和特征工程、模型选择与超参数优化以及工作流程评估——越来越多地被集成到复杂的软件系统中。手动构建这些工作流程需要深厚的ML专业知识、领域知识以及大量的工程投入。自动化ML（AutoML）框架在一定程度上解决了这些问题，但通常面临搜索空间受限、适应性差和可解释性低等局限性。大型语言模型（LLMs）的最新进展为通过利用其在语言理解、推理、交互和代码生成方面的能力来自动化和优化ML工作流程提供了新的机会，同时也为软件工程（SE）带来了新的实际和理论挑战。本调查首次从软件工程的角度，对基于LLM的ML工作流程自动化进行了分阶段的综述。我们提出了一套涵盖所有

来源：ACM Transactions on Software Engineering and Methodology

时间：2025-11-08
基于RFID谐波的亚毫米级振动传感

摘要在工业监测中，准确检测微弱的机械振动对于实施有效的预防性维护策略和提高设备寿命至关重要。然而，目前的基于RFID的传感技术受到环境噪声和信号波长固有限制的阻碍。为了解决这些问题，我们推出了TagVibra，这是一种采用了差分相位放大（DPA）算法的创新RFID系统。该算法利用了RFID技术的调制特性以及RFID标签的谐波效应，显著提高了振动检测的准确性。TagVibra已在USRP平台上得到应用，实验结果证实其能够检测到小至0.3毫米的微小振动，平均频率估计误差小于0.9赫兹。这一突破显著提升了在高精度工业环境中进行早期故障诊断的能力。

来源：ACM Transactions on Sensor Networks

时间：2025-11-08
埃米纳姆（Eminem）：高效FPGA实现混合RadIx NTT硬件加速器，用于NIST的后量子密码学项目Falcon、Dilithium和HAWK

摘要量子计算的出现对现代密码学构成了重大威胁。为应对这一挑战，美国国家标准与技术研究院（NIST）启动了PQC（后量子密码学）标准化进程，并选出了几种算法（其中一些仍在进一步标准化过程中进行评估）。在这些方案中，基于格的后量子密码学（PQC）作为一种有前景的方法引起了实施社区的广泛关注，尤其是在硬件平台方面。值得注意的是，现场可编程门阵列（FPGA）作为一种便捷的硬件实现平台，不仅得到了NIST的重视，也得到了研究界的关注，这从NIST的相关建议以及近期发表的众多研究作品中可见一斑。本工作延续了开发新型FPGA实现PQC的现有趋势。值得一提的是，这些基于NIST格的PQC算法中的多项式乘法可以

来源：ACM Transactions on Reconfigurable Technology and Systems

时间：2025-11-08
AHCA：基于FPGA的Hashcat加速敏捷设计框架

摘要本文提出了AHCA（一种基于FPGA的Hashcat加速的敏捷设计框架），该框架能够自动生成优化的寄存器传输级（RTL）代码。我们的方法围绕一种自动设计方法展开，该方法使用了参数化的领域特定模板（DST）和特定的硬件操作符库。该框架通过分析算法图来提取关键的硬件操作符及其互连网络。为了支持多样化的用户输入，我们引入了一种创新的操作符匹配策略，该策略利用子图同构性将算法映射到我们的操作符库中。将这些匹配信息与设计空间探索（DSE）相结合，用于配置DST并生成最终的RTL代码，从而避免对先前实现算法的重复编码。与最先进的高级综合（HLS）工具相比，AHCA实现了最高797倍的性能提升、高达10

来源：ACM Transactions on Reconfigurable Technology and Systems

时间：2025-11-08
一种基于FPGA的高能效、实时点云配准框架，具备超快且可配置的多模态对应关系搜索功能

摘要点云配准是基于激光雷达的定位和地图构建中的基本任务，在机器人技术和自动驾驶汽车中得到广泛应用。然而，现有的配准方法会丢失几何拓扑的连续性，并且缺乏对扫描线的感知和可配置的对应关系搜索功能，这限制了它们的实时应用能力。为了解决这些问题，我们提出了一个经过根本性重构的、节能的FPGA框架，用于实时点云配准，该框架具有一个可配置的多模式对应关系搜索引擎。首先，我们引入了一种基于扫描线的范围投影结构（SA-RPS），它将激光雷达点重新组织到可配置的分割域中，并保持扫描线的拓扑结构，从而实现高效且灵活的多模式对应关系搜索。其次，我们开发了一种基于SA-RPS的深度流水线加速器（SA-RPS-CS），

来源：ACM Transactions on Reconfigurable Technology and Systems

时间：2025-11-08
TaskEval：评估大型语言模型代码生成任务的难度

摘要大型语言模型（LLMs）在代码生成等与代码相关的任务中表现出色，但基准测试评估往往忽略了任务的特性，例如难度。此外，基准测试通常使用单一提示来构建任务，尽管提示的制定对结果有着深远的影响。本文介绍了一种通用方法 TaskEval，该框架利用多种提示和项目反应理论（IRT）来有效评估 LLMs 的能力及任务特性，从而提高对其性能的理解。通过使用两个代码生成基准测试 HumanEval+ 和 ClassEval，以及 8 个代码生成 LLM，我们证明了 TaskEval 能够描述任务的属性。通过主题分析，我们识别并分析了基准测试中包含的 17 个和 21 个主题的任务。我们还分析了任务特性与

来源：ACM Transactions on Software Engineering and Methodology

时间：2025-11-08
“越大并不总是越好”：探索用于日志语句生成的小型开源语言模型

摘要开发人员使用日志记录语句来创建日志，以记录系统行为并辅助软件维护。因此，高质量的日志记录对于有效的维护至关重要；然而，手动日志记录往往会导致错误和不一致性。最近的方法强调使用大型语言模型（LLMs）来自动生成日志记录语句，但这些方法存在隐私和资源问题，限制了它们在企业中的适用性。本文首次进行了大规模的实证研究，评估小型开源语言模型（SOLMs）在自动生成日志记录语句方面的性能。我们使用多种提示策略和参数高效的微调技术（如低秩适应（LoRA）和检索增强生成（RAG））来评估四种知名的小型开源语言模型。研究结果表明，经过LoRA和RAG提示微调的小型开源语言模型，特别是Qwen2.5-code

来源：ACM Transactions on Software Engineering and Methodology

时间：2025-11-08
LHAM：一种低成本、高精度的近似乘法器，适用于基于FPGA的计算

摘要人工智能的快速发展对智能设备的性能提出了更高的要求，需要开发出资源使用率和功耗更低的新计算单元。近似乘法器（AMs）通过牺牲计算精度来降低资源消耗和功耗，因此在图像处理和深度神经网络等领域得到了广泛应用。在本文中，我们提出了一种针对现场可编程门阵列（FPGAs）的低成本、高性能近似乘法器（LHAM）设计方法。我们对基于FPGA的阵列前置加法器（CLA）的进位传播和进位生成表达式进行了优化，有效减少了因丢弃进位生成信息而产生的误差。结合这些表达式和基于逻辑融合的近似策略，我们设计了既能保证精度又能实现近似计算的加法器。这些加法器可以在乘法器的部分积累积阶段进行选择性配置，从而在计算精度和硬件

来源：ACM Transactions on Reconfigurable Technology and Systems

时间：2025-11-08
freeDoppler：一个用于基于射频（RF）进行精确速度估计的多普勒效应学习网络

摘要准确估计移动目标的速度（包括速度和方向）最近在增强现实、安全监控和体育健康领域引起了广泛关注。特别是基于多普勒频移（DFS）的速度估计方案，利用WiFi设备展示了巨大的潜力，并已被广泛研究。然而，以往基于快速傅里叶变换（FFT）和路径参数的方法在DFS估计中存在固有局限性，更糟糕的是，这些方法忽略了移动目标与WiFi收发器之间相对位置导致的非线性测量误差。这些局限性使得在实际应用中难以满足对精细速度估计的需求。为了解决这些问题，本文提出了一种基于学习的速度估计框架freeDoppler，以实现精细的、多目标的、与目标方向无关的速度估计。具体而言，我们构建了一个基于WiFi的速度估计网络（V

来源：ACM Transactions on Sensor Networks

时间：2025-11-08
Citadel：基于上下文相似性的深度学习框架缺陷检测

摘要随着深度学习技术的应用，深度学习框架测试工具的需求日益增长。现有的深度学习框架测试工具在覆盖错误类型方面存在局限性。例如，它们无法有效发现影响模型性能、经济性和环境因素的性能错误。此外，现有工具效率低下，虽然能生成大量测试用例，但只有少数能够触发实际错误。在本文中，我们提出了一种名为Citadel的方法，该方法在效率和效果上显著提升了错误检测的速度。我们观察到，许多深度学习框架中的错误具有相似性，这是因为属于同一类的操作符和算法之间存在相似性。Citadel与现有的错误检测工具不同，它旨在发现与已知测试用例相匹配的新错误。该工具通过定义“上下文相似性”来衡量深度学习框架API对之间的相似性

来源：ACM Transactions on Software Engineering and Methodology

时间：2025-11-08
深度学习运算符实现中浮点精度调优的研究

摘要深度学习（DL）已在众多领域发挥了重要作用，因此确保DL系统在训练和推理过程中的稳定性至关重要。DL模型的计算可以被视为一系列DL运算符的执行过程，这些运算符是执行核心数值计算的关键组件。因此，这些运算符的数值稳定性对这些系统的整体质量具有决定性影响。数值不稳定的运算符可能会导致模型性能下降，甚至引发干扰训练过程的数值异常。提高特定浮点计算精度的做法被广泛采用来提升数值稳定性。然而，确定内部计算所需的合适数据类型（即精度调优）仍然是一个重大挑战。本文首次系统地研究了DL运算符实现中的精度调优问题。我们介绍了OpScanner，该工具能够提取对运算符数值稳定性至关重要的精度转换操作。利用捕获

来源：ACM Transactions on Software Engineering and Methodology

时间：2025-11-08
交通标志上的“隐形对抗条纹”：对自动驾驶车辆的威胁与防护措施

摘要基于摄像头的计算机视觉对自动驾驶车辆的感知至关重要。本文介绍了一种攻击方法，该方法利用发光二极管并利用相机的滚动快门效应在捕获的图像中生成干扰条纹，从而误导交通标志的识别。这种攻击具有隐蔽性，因为人类无法察觉到交通标志上的这些条纹。为了使攻击具有威胁性，识别结果需要在连续的图像帧中保持稳定。为此，我们设计并实现了名为GhostStripe的攻击系统，该系统能够控制调制光发射的时机，以适应相机的操作和目标车辆的运动。在真实测试平台上进行的评估表明，当目标车辆经过该路段时，GhostStripe能够使高达94%的图像帧的交通标志识别结果被错误分类。在现实中，这种攻击效果可能会导致目标车辆陷入危

来源：ACM Transactions on Sensor Networks

时间：2025-11-08
通过对基于物联网的公交车队中逐步发生的故障进行无监督聚类来实现预测性维护

摘要预测性维护涉及从机器中收集数据，并使用算法来分析机器的状态或判断机器是否需要维护或修理。本文提出了一种基于聚类的预测性维护算法，用于检测基于物联网（IoT）的公交车的潜在故障和逐渐恶化的情况。研究表明，预测性维护能够提高成本和时间效率，并通过实施预防性维护措施来增强用户安全性。虽然本文实现的预测模型主要关注冷却系统和发动机扭矩系统，但所提出的方法具有灵活性，可以扩展到其他子系统。为了解决数据不足的问题，本文还生成了合成数据集来模拟正常状态和存在潜在故障的公交车。在模拟78辆公交车的合成数据集上的实验表明，聚类的质量很高，轮廓得分分别达到了0.99（冷却系统）和0.88（发动机系统）。此外，

来源：ACM Transactions on Sensor Networks

时间：2025-11-08
HiFA：一种高性能且灵活的加速框架，用于大规模数论变换

摘要零知识证明（ZKP）和同态加密（HE）对于云、区块链和分析等应用中的数据隐私至关重要。然而，在实际应用中，这些技术往往面临性能挑战，尤其是在执行多项式乘法所需的数论变换（NTT）时，当涉及的大小超过2^20或整数宽度较大（例如256位）时尤为明显。FPGA为加速计算提供了一个有前景的平台，但由于片上资源有限，高效实现大尺寸的NTT仍然具有难度。广泛采用的四步NTT方法虽然减少了对外部大容量内存（HBM）的需求，但却引入了性能瓶颈。首先，传统的数据流NTT架构可能无法充分利用可用的计算能力，从而阻碍了性能的提升；此外，在矩阵转置阶段，对非顺序访问外部高带宽内存（HBM）会导致效率低下。为了解

来源：ACM Transactions on Reconfigurable Technology and Systems

时间：2025-11-08
综述：量子计算机模拟：综述与加速机会

摘要量子计算有潜力通过解决当前经典计算机无法在合理时间内解决的复杂问题来彻底改变多个领域。然而，量子计算机的发展仍处于早期阶段，现有的系统资源非常有限。因此，目前开发和测试量子算法最实际的方法是使用经典计算机模拟器。此外，新型量子计算机及其组件的开发也依赖于模拟技术。鉴于量子计算机的特性，对其进行模拟在计算和存储方面都是一项要求很高的任务。因此，当前经典系统中的模拟效果并不理想，需要在不同层面上应用各种优化和近似技术。本文综述了量子计算机的组成部分、这些组件以及整个量子计算机可被模拟的层次，并深入分析了各种先进的加速方法。除了可以在算法层面进行的优化外，本文还介绍了最具前景的、针对硬件的优化措

来源：ACM Transactions on Quantum Computing

时间：2025-11-08
接近海森堡极限的量子计算

摘要量子计算的基本限制来自于普朗克常数（通过海森堡极限）。在给定时间内消耗的能量，或者在使用特定能量预算的情况下处理信息的速度，是量子计算的核心研究焦点。迄今为止，所实现的最小作用量（即能量-时间成本）大约为 h=6.63 × 10−34J⋅s。在我们的研究中，我们通过自旋-自旋磁相互作用实验，实现了 10−29J⋅s 的作用量，从而可逆地操控单个自旋量子比特。通过遵循最小作用量原理，我们的理论和实验结果确定了所需的最小作用量。我们的发现突显了自旋量子计算机在计算密集型应用（如人工智能和后量子密码学）中的潜力，因为它们具有以下独特优势：1. 高能量效率（接近海森堡极限）；2. 高密度集成（每个

来源：ACM Transactions on Quantum Computing

时间：2025-11-08
深度学习编译器中的误报漏洞报告：阶段、根本原因及缓解措施

摘要深度学习（DL）编译器是优化DL模型以在异构硬件上高效运行的关键基础设施。与传统编译器一样，它们也容易出错。然而，并非所有提交到DL编译器仓库的错误报告都反映了真实的缺陷。许多错误报告实际上是误报，由配置错误或用户误解引起。这些报告可能会误导开发者，浪费调试资源，并延迟关键错误的修复。本文首次全面研究了DL编译器中的误报问题，分析了来自两个代表性系统TVM和OpenVINO的1,075个已关闭的问题和讨论。我们发现，误报问题需要开发者投入大量精力，且贯穿整个编译工作流程，尤其是在构建、导入以及中间表示（IR）转换阶段；其原因通常包括环境配置错误、使用不当，或对编译器特性和限制的误解。为了解

来源：ACM Transactions on Software Engineering and Methodology

时间：2025-11-08

页次：2724/9736 共194715篇文章
分页：[<<][2721][2722][2723][2724][2725][2726][2727][2728][2729][2730][>>][首页][尾页]

高级人才招聘专区