
-
生物通官微
陪你抓住生命科技
跳动的脉搏
理解并改进易出错的测试分类问题
《Proceedings of the ACM on Programming Languages》:Understanding and Improving Flaky Test Classification
【字体: 大 中 小 】 时间:2025年11月07日 来源:Proceedings of the ACM on Programming Languages
编辑推荐:
易测测试分类存在实验设计缺陷和数据集不现实问题,导致现有模型高估准确率。本文提出FlakeBench数据集和FlakyLens模型,在修正实验后F1分数提升至65.79%,优于CodeLlama和DeepSeekCoder。通过代码token归因分析发现模型依赖特定代码token而非语义理解,对抗扰动测试显示关键token可使准确率波动达-18.37pp,揭示模型泛化能力不足。
生物通微信公众号
知名企业招聘