APR中的补丁生成:从利用大语言模型(LLMs)和使用APR特定信息的角度进行的综述
《ACM Transactions on Software Engineering and Methodology》:Patch Generation in APR: A Survey from the Perspectives of Utilizing LLMs and Using APR-Specific Information
【字体:
大
中
小
】
时间:2025年11月08日
来源:ACM Transactions on Software Engineering and Methodology
编辑推荐:
自动程序修复(APR)作为LLMs下游任务,面临整合APR-specific信息的挑战。研究从LLMs应用和APR信息整合双视角展开:定义APR-specific信息概念,归纳四类LLMs在补丁生成中的应用技术,分析提示上下文和微调配置等关键影响因素,探讨基准测试和推理成本评估方法,系统提炼包含缺陷修复对的APR-specific知识库,并总结LLM时代APR的现存问题与未来方向。
摘要
自动化程序修复(APR)是软件开发和维护中的关键任务,其目标是在无需人工干预的情况下自动修复软件漏洞。大型语言模型(LLMs)的出现显著推动了APR技术的发展。然而,随着研究人员深入探索将APR作为LLMs的下游任务,一个关键挑战仍然存在:如何有效地整合与APR相关的信息以补充LLMs的能力。本综述回顾了124项现有的APR研究,这些研究大多发表于2021年至2024年间,从两个角度进行了分析:一是利用LLMs,二是利用与APR相关的信息。首先,我们定义了与APR相关的信息的概念;接着,我们总结了在四个维度上利用LLMs生成补丁的技术;随后,我们探讨了影响LLMs生成补丁效果的关键因素,如提示上下文和微调配置;之后,我们重点评估了生成的补丁,包括基准测试、推理成本等方面的表现;此外,我们提炼了所有与APR相关的信息(例如漏洞修复对和错误信息),强调了它们的独特重要性和特征;最后,我们全面总结了在LLM时代APR领域面临的挑战、局限性以及潜在的未来研究方向。通过采用这两种视角,我们旨在为APR社区提供有关如何挖掘和利用与APR相关的信息以辅助LLMs工作的宝贵见解。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号