YourCoLo:利用一对多关系和代码间的关联进行基于用户评价的代码本地化
《ACM Transactions on Software Engineering and Methodology》:YourCoLo: Leveraging One-to-Many Relationships and Inter-Code Connections for User Review-Based Code Localization
【字体:
大
中
小
】
时间:2025年11月08日
来源:ACM Transactions on Software Engineering and Methodology
编辑推荐:
针对用户评论与代码片段匹配问题,提出YourCoLo方法,通过整合项目上下文、处理一对多关系及代码间关联性,显著优于现有模型,提升MRR和MAP指标。
摘要
在移动设备无处不在的时代,像Google Play商店这样的数字分发平台已经成为了我们日常生活不可或缺的一部分,它们托管着数百万应用程序,服务于数十亿用户。用户可以留下评论,为开发者提供宝贵的反馈,包括对新功能的请求和问题报告。这些用户评论在软件开发、测试和维护中起着至关重要的作用,因为它们能让开发者了解用户的需求和潜在问题,这促使我们重新思考一个关键问题:根据用户评论,我们如何自动从软件代码库中识别出相关的代码片段,以帮助开发者解决这些问题?
现有的解决这个问题的方法通常涉及计算用户评论与代码片段之间的相似性。然而,我们发现了三个主要限制。首先,尽管现有方法在个别项目上取得了有希望的结果,但它们的高性能无法跨项目推广。其次,现有的方法将问题建模为用户评论与代码片段之间的一对一关系,忽略了实际存在的一对多关系。第三,现有方法仅关注评论与代码片段之间的直接关系,而忽略了代码片段本身之间的相互关联,而这些关联中包含着有助于准确识别相关代码的宝贵信息。为了解决这些限制并推动技术进步,我们提出了YourCoLo,这是一种全新的方法,它充分利用了上下文信息、一对多关系以及代码片段之间的相互联系。具体来说,YourCoLo基于三种创新设计:(1)一种增强提示的机制,用于将丰富的项目级上下文融入代码定位过程中;(2)一种新的损失函数,用于处理用户评论与多个相关代码片段之间的一对多关系;(3)一种排名策略,考虑了相关代码片段之间的相互关联。我们的实验评估表明,YourCoLo在性能上显著优于现有的最先进模型,在方法层面上超过了CodeBERT、CodeLlama和GraphCodeBERT,分别提高了18.3%、9.3%和7.7%;在文件层面上(以平均倒数排名计)分别提高了18.4%、7.7%和7.0%。此外,与现有方法相比,YourCoLo在方法层面上和文件层面上平均精确度(MAP)也分别提高了8.8%和6.8%。这些结果凸显了YourCoLo的有效性,以及它指导开发者更准确地找到与用户反馈最相关的代码片段的潜力。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号