超越传统置信预测:基于自适应置信推理的非交换数据不确定性量化新方法

【字体: 时间:2025年06月24日 来源:Pattern Recognition 7.5

编辑推荐:

  本研究突破性地证明自适应置信推理(ACI)无需依赖传统置信预测(CP)框架,通过引入嵌套预测集特性的广义置信预测器(NCCP),在非交换数据场景下实现了同等效力的有限样本覆盖保证。实验表明NCCP在在线计算中具有显著优势,而归纳NCCP(INCCP)在批量场景下因无需校准集可提升预测效率,为医疗诊断等安全关键领域的机器学习不确定性量化提供了新范式。

  

在医疗诊断和自动驾驶等安全关键领域,机器学习模型的不确定性量化至关重要。然而当前深度学习方法普遍存在校准不足问题,当模型声称80%置信度时,实际正确率往往难以匹配。传统置信预测(Conformal Prediction, CP)虽能提供分布自由的 uncertainty quantification,但其有效性严格依赖数据可交换性假设,这在实际非平稳时间序列等场景中常被违背。针对这一困境,Gibbs和Candès提出的自适应置信推理(Adaptive Conformal Inference, ACI)通过动态调整显著性水平,在非交换数据下实现了渐进有效性。但学界长期存在一个潜在假设:ACI必须与CP结合使用。

这项发表在《Pattern Recognition》的研究颠覆性揭示了ACI的理论本质——其有限样本保证实际上独立于CP框架。研究团队通过理论证明和系统实验阐明:只要预测器满足边界条件(ε≥1时输出空集,ε≤0时输出全集),任何嵌套预测集的置信预测器(Confidence Predictor)都能与ACI协同工作。为验证这一发现,研究人员设计了四组对比实验:在线分类采用USPS手写数字数据集,在线回归使用葡萄酒质量数据;离线场景分别用随机森林构建ICP和INCCP模型。关键技术包括非交换性数据模拟、动态显著性水平调整算法(式3)、Winkler区间评分(式8)等评估体系。

研究结果部分,"在线分类"实验显示,k近邻CP与NCCP的观测冗余度(OE)分别为0.039和0.051,虽CP略优但差异微小;"在线回归"中,两种方法的平均Winkler评分仅相差0.0087,且NCCP计算效率显著提升。"离线分类"部分尤为关键,INCCP的平均OE稳定在0.05左右,显著优于ICP的0.6,且无需分割训练集;"离线回归"实验发现,当校准集占比达99%时ICP才勉强接近INCCP性能,但方差急剧增大。这些发现通过式4的有限样本保证理论得到支撑:|ε - 1/N Σerrnεn(Γ)| ≤ (max{ε1,1-ε1}+γ)/γN。

结论部分明确指出,ACI本质是控制理论中的误差调节器,其有效性源于迭代更新机制而非特定预测器属性。这解释了为何非置信预测器(NCCP)在保持嵌套集特性前提下,既能继承ACI的理论保证,又能在计算效率上超越CP。在临床决策支持系统等场景中,该发现意味着可以绕过CP的复杂计算,直接基于现有模型的置信度输出构建更高效的预测区间。讨论部分强调了三方面突破:理论层面解耦了ACI与CP的绑定关系;方法学上为小样本和时间序列预测提供了新工具;应用端启示临床AI系统开发者可基于INCCP重构不确定性量化模块。未来研究可探索初始条件优化、变步长ACI算法等方向,推动控制理论与机器学习预测的深度融合。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号