用于代码翻译的大型语言模型:对代码异味及功能正确性的深入分析

《ACM Transactions on Software Engineering and Methodology》:Large Language Models for Code Translation: An In-Depth Analysis of Code Smells and Functional Correctness

【字体: 时间:2025年11月20日 来源:ACM Transactions on Software Engineering and Methodology

编辑推荐:

  代码翻译中基于大语言模型(LLMs)的代码质量与正确性分析,发现提示选择显著影响LLMs性能,代码质量作为独立维度可优化,非确定性利用、迭代修复及多模型协作有效提升效果,回译方法缓解源代码质量问题,但LLMs易复现训练时的代码异味。

  

摘要

将程序代码从一种给定的源编程语言(PL)转换为另一种目标编程语言(PL)的过程称为代码翻译,其应用范围非常广泛。由于大型语言模型(LLMs)在不同的应用领域都表现出出色的性能,因此研究认为可以利用LLMs来弥补传统代码翻译方法的不足。然而,现有文献主要关注代码的正确性,而未能充分探讨转换后代码的质量。为此,我们对基于LLM的代码翻译所产生的代码异味(code smells)和代码正确性进行了深入分析,以填补这一空白。我们研究了多种LLMs、数据集、编程语言以及提示(prompts),发现提示的选择对LLM的性能有显著影响。分析还表明,代码质量可以被视为一个与代码正确性相对独立的性能指标。此外,合理利用LLM的非确定性、采用迭代修复方法以及让多个LLM协同工作,可以提高翻译性能。令人惊讶的是,我们发现回译(backtranslation)方法可以有效解决源代码中的质量问题,并且LLMs似乎能够重现其在训练过程中学到的代码异味。
相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号