可转移变分自编码器方法在半监督锂离子电池异常检测中的应用

《Journal of Energy Storage》:Transferable variational autoencoder approach for semi-supervised lithium-ion battery anomaly detection

【字体: 时间:2026年01月04日 来源:Journal of Energy Storage 9.8

编辑推荐:

  针对锂离子电池安全检测中标注数据不足的问题,提出一种基于变分自编码器(VAE)与高斯混合模型(GMM)的半监督异常检测框架,结合预训练与迁移学习策略,在三个独立数据集上验证,检测准确率超过0.95,为大规模电池管理提供有效技术方案。

  
王青泉|高振宇|李凯翔|孙晔|徐成山|胡倩倩|冯绪宁|李卫华
华南理工大学机械与汽车工程学院,广州,510640,中国

摘要

与锂离子电池相关的安全事件挑战要求开发出可靠的电池异常检测系统,以确保其安全、大规模的应用。然而,实际应用中电池异常检测受到有限标记异常数据的限制,而这正是许多现有方法的关键需求。本文提出了一种半监督异常检测策略,采用变分自编码器(VAE)来应对这一问题。通过在大规模电池数据集上进行预训练并执行迁移学习,该方法显著提升了异常检测性能。在两个独立电池数据集上的实验结果表明,该方法在异常检测方面具有很高的准确性。这突显了其作为有前景的框架和先进电池系统安全增强技术的价值。

引言

锂离子电池是可再生能源系统中的不可或缺的组成部分,尤其是在电动汽车(EV)和储能系统(ESS)中,这得益于它们的高能量密度和延长的循环寿命[[1], [2], [3]]。根据国际能源署(IEA)的《2024年全球电动汽车展望》,2023年全球对电动汽车电池的需求激增至750吉瓦时,比上一年增长了40%,预计到2030年代这一数字将上升至太瓦时级别[4,5]。这一增长反映了全球对清洁能源的推动,包括电动汽车的广泛采用以及对太阳能和风能等可再生能源的存储需求的增加[[6], [7], [8]]。然而,频繁的安全事件已成为进一步推广锂离子电池的瓶颈[[9], [10], [11]]。
尽管锂离子电池发生安全事件的概率相对较低,但其潜在后果却非常严重且突然,主要表现为由于热失控引起的火灾和爆炸[[12,13]]。热失控通常由电气、热或机械滥用引发——例如过充、过热、短路或物理损坏[[14], [15], [16], [17]]。大量研究表明,这些滥用情况会导致内部温度迅速升高,从而引发无法控制的放热反应[[18], [19], [20], [21]]。电池故障机制的复杂性,特别是内部短路的多种原因,大大增加了早期热失控检测的难度[[22,23]]。
异常检测提供了一种预测性解决方案,可以降低热失控等安全风险,从而提高锂离子电池系统的可靠性和安全性[[24,25]]。通过早期识别潜在故障,异常检测为预防灾难性故障提供了积极保障,这在高风险应用(如电动汽车和电网规模的储能系统)中尤为重要[[26,27]]。异常检测系统能够实时监测关键电池参数(如电压、温度和内部压力或膨胀力),以检测表明潜在故障的微妙偏差[[24,28]]。早期发现这些异常可以采取预防措施,避免热失控[[29]]。
最近的数据驱动和机器学习方法的进步显著增强了异常检测系统的能力[[30], [31], [32]]。相关的一项工作是张等人开发的动态自编码器框架,该框架在大型现场数据集上进行了训练,与传统方法相比,AUROC提高了16-33%,展示了深度学习在捕捉复杂故障模式方面的潜力[[33]]。吴等人提出了一种结合时间序列分解和改进的曼哈顿距离算法的异常检测方法,用于检测单个电池单元的异常[[34]]。李等人整合了一个特征工程驱动的框架,用于检测实际电动汽车中锂离子电池的多尺度电压异常[[35]]。贾等人引入了一个多场景数据驱动框架,该框架结合了特定场景的特征选择、改进的Transformer-GAN模型和改进的累积和算法来检测电动汽车电池异常[[28]]。然而,在实际运行条件下异常样本的稀缺性要求开发能够在少量或无标记实例的情况下有效工作的异常检测方法[[24,36]]。
为了克服昂贵数据标注和故障样本稀缺的挑战,本研究提出了一种基于半监督变分自编码器(VAE)和迁移学习的异常检测方法,以使用最少的标记数据实现高效检测[[33,37]]。VAE从有限的标记数据和大量的未标记数据中学习正常电池行为,从而实现异常识别[[38,39]]。然后对预训练模型进行微调并转移到新的、完全未标记的数据集上。本文的主要贡献如下:
  • 1.
    开发了一种基于VAE和高斯混合模型(GMM)的新半监督异常检测方法,以解决锂离子电池安全数据不足的问题。
  • 2.
    引入了一个预训练和迁移框架,该框架利用大规模电池数据集显著提高了小型、标记稀缺数据集上的检测性能。
  • 3.
    在多个数据集上的广泛实验显示,检测准确率超过了0.95,为大规模电池管理和先进电池系统提供了新的见解和技术解决方案。
  • 本文的其余部分安排如下。第2节介绍了基于VAE和GMM的异常检测方法以及迁移学习过程。第3节讨论了数据集和模型预训练及微调的细节。第4节对结果进行了深入分析和讨论。最后,第5节总结了本文。

    方法论

    本节首先介绍了基于VAE的预训练和基于GMM的密度估计的异常检测框架。随后,开发了一种迁移学习方法,利用少量未标记数据在新数据集上进行异常检测。基于VAE和GMM的框架及预训练和迁移学习的过程如图1所示。

    数据集

    所提出的框架使用三个公开可用的真实世界电动汽车数据集(Dahu、Socea和Naobop)进行训练和验证,这些数据集由张等人发布,共包含347辆电动汽车[[33]]。这些数据集特别有价值,因为它们的车辆级故障标签来自驾驶员报告,并随后由工程师进行了确认。这一验证过程基于识别特定的故障特征,如锂镀层、低电量

    不同数据集上的检测性能

    图4展示了应用所提出的VAE-GMM框架并进行迁移学习后,在三个不同数据集上进行异常检测得到的混淆矩阵。如第3节所述,VAE模型在源数据集(Dahu)上进行了预训练,随后在目标数据集(Socea和Naobop)上进行了微调以进行异常检测。图4a显示了模型在源数据集上的高准确性,特征为28个真正例、167个假负例和仅1个假正例,表明了强大的检测能力

    结论

    本文提出了一种全面的锂离子电池异常检测框架,该框架结合了VAE和预训练及微调策略,并可选地使用了GMM进行潜在空间分析。在标记良好的电池数据集上进行的大规模预训练使VAE学习了稳健的潜在表示,然后这些表示有效地转移到了较小或未标记的数据集上进行微调。通过选择性地冻结部分编码器参数并采用简化的方法

    CRediT作者贡献声明

    王青泉:撰写——原始草稿、方法论、调查、形式分析、概念化。高振宇:调查、形式分析、数据管理。李凯翔:监督、方法论、数据管理、概念化。孙晔:可视化、方法论。徐成山:撰写——审稿与编辑、监督、项目管理、调查、资金获取。胡倩倩:项目管理、调查。冯绪宁:监督、项目管理、资金

    利益冲突声明

    作者声明他们没有已知的财务利益或个人关系可能影响本文报告的工作。

    致谢

    本研究得到了国家重点研发计划-战略性科学技术创新合作 [资助编号:2022YFE0207900];国家自然科学基金 [资助编号:52422609];以及清华大学智能绿色车辆与移动性国家重点实验室的独立研究项目(编号:ZZ-PY-20250109)的支持。
    相关新闻
    生物通微信公众号
    微信
    新浪微博
    • 搜索
    • 国际
    • 国内
    • 人物
    • 产业
    • 热点
    • 科普

    热点排行

      今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

      版权所有 生物通

      Copyright© eBiotrade.com, All Rights Reserved

      联系信箱:

      粤ICP备09063491号