综述：用于构建可信人工智能的机器“去学习”方法：技术、挑战及应用的系统综述

首页今日动态人才市场新技术专栏中国科学人云展台
BioHot
云讲堂直播会展中心特价专栏技术快讯免费试用

生物通官微
陪你抓住生命科技
跳动的脉搏

生物通首页 > 今日动态 > 正文

《ARCHIVES OF COMPUTATIONAL METHODS IN ENGINEERING》：Machine Unlearning for Trustworthy AI: A Systematic Review of Techniques, Challenges, and Applications

【字体：大中小】 时间：2025年10月23日 来源：ARCHIVES OF COMPUTATIONAL METHODS IN ENGINEERING 12.1

编辑推荐：

　　机器忘却是满足GDPR等数据隐私法规的关键技术，但现有算法碎片化导致效率、模型精度与计算成本难以平衡。本文通过系统综述130余项研究，提出统一分类框架，揭示精确方法应用受限、近似方法缺乏理论保证、LLMs与FL隐私保护是两大前沿难题，并指出需加强验证、优化权衡、标准化建设等方向。

摘要

机器去学习（Machine Unlearning）是指高效地消除训练模型中数据影响的过程，这一能力对于遵守数据隐私法规（如GDPR中的“被遗忘权”）至关重要。然而，去学习算法的迅速普及导致了该领域的碎片化和复杂性，使得在去学习效果、模型保真度和计算成本之间进行权衡变得十分困难。为了解决这一问题，本文对机器去学习领域进行了系统而全面的调查，建立了统一的分类体系，并对基础方法和先进技术进行了深入分析，为未来的研究指明了方向。通过对130多项关键研究的系统梳理，我们得出了三个重要发现：首先，尽管精确方法能够提供可靠的保障，但其实际应用主要局限于专门为去学习而设计的模型；其次，大多数近似方法在深度神经网络上的有效性缺乏严格的理论支持，并且其效果高度依赖于具体情境；第三，当前研究前沿主要集中在两个具有重大影响的未解决领域：大规模语言模型（LLMs）的可扩展去学习技术以及联邦学习（FL）中的隐私保护去学习技术。我们认为，虽然机器去学习是构建可信人工智能的基础支柱，但在理论承诺与实际可验证部署之间仍存在显著差距。本文指出了亟需解决的关键挑战，包括如何实现鲁棒的验证机制、平衡模型保真度和去学习效果以及推动标准化进程，并提出了一个以主动应对、融合隐私保护原则和确保技术可扩展性为目标的研究议程。

机器去学习是指高效地消除训练模型中数据影响的过程，这一能力对于遵守数据隐私法规（如GDPR中的“被遗忘权”）至关重要。然而，去学习算法的迅速普及导致了该领域的碎片化和复杂性，使得在去学习效果、模型保真度和计算成本之间进行权衡变得十分困难。为了解决这一问题，本文对机器去学习领域进行了系统而全面的调查，建立了统一的分类体系，并对基础方法和先进技术进行了深入分析，为未来的研究指明了方向。通过对130多项关键研究的系统梳理，我们得出了三个重要发现：首先，尽管精确方法能够提供可靠的保障，但其实际应用主要局限于专门为去学习而设计的模型；其次，大多数近似方法在深度神经网络上的有效性缺乏严格的理论支持，并且其效果高度依赖于具体情境；第三，当前研究前沿主要集中在两个具有重大影响的未解决领域：大规模语言模型（LLMs）的可扩展去学习技术以及联邦学习（FL）中的隐私保护去学习技术。我们认为，虽然机器去学习是构建可信人工智能的基础支柱，但在理论承诺与实际可验证部署之间仍存在显著差距。本文指出了亟需解决的关键挑战，包括如何实现鲁棒的验证机制、平衡模型保真度和去学习效果以及推动标准化进程，并提出了一个以主动应对、融合隐私保护原则和确保技术可扩展性为目标的研究议程。

热点排行

新闻专题

联系信箱：

粤ICP备09063491号