ABC:通过模型融合实现通用代码样式器

《Proceedings of the ACM on Programming Languages》:ABC: Towards a Universal Code Styler through Model Merging

【字体: 时间:2025年11月07日 来源:Proceedings of the ACM on Programming Languages

编辑推荐:

  本文提出ABC框架,解决现有代码风格转换模型在组合风格处理上的局限。通过四个规模模型验证,性能提升最高达86.7%,并构建BCCStyle数据集和CS4BLEU评估指标。

  

摘要

基于代码语言模型(code LMs)构建的代码风格转换模型取得了显著的成果。然而,这些模型通常专注于基础风格转换,即目标风格遵循单一标准,而在处理组合风格转换时往往面临困难,因为组合风格涉及多个标准。实际上,风格指南中包含多个标准,因此缺乏有效的组合风格转换能力成为这些模型在实际应用中的主要限制。
在本文中,我们提出了“Absent-Basis-Combination”(简称ABC)这一新颖的代码风格转换框架,该框架显著提升了组合风格转换的性能,并克服了现有方法的局限性。我们实现了四种不同参数规模的ABC版本,分别为0.5B、1.3B、1.5B和3B,结果表明在所有模型规模下,ABC在基础风格转换和组合风格转换方面均明显优于现有方法。具体而言,ABC的性能提升幅度可达86.70%,即使基线方法使用的参数量是ABC的三倍,其优势依然明显。此外,为了解决高质量数据集和评估指标的缺乏问题,我们构建并发布了一个新的风格转换数据集——“Basis & Combination Code Style”(简称BCCStyle),并引入了一种新的代码相似性度量方法——“Code Sequence, Syntactic, Semantic and Stylistic BLEU”(简称CS4BLEU),该度量方法在准确性和一致性方面均优于现有指标。
相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号