确定性评分在机器学习分类和异常检测中的应用
《ACM Transactions on Probabilistic Machine Learning》:Applications of Certainty Scoring for Machine Learning Classification and Out-of-Distribution Detection
【字体:
大
中
小
】
时间:2025年11月08日
来源:ACM Transactions on Probabilistic Machine Learning
编辑推荐:
针对机器学习分类中不确定性量化的重要性,本文提出基于预测概率的理论框架,量化模型预测的确定性(certainty)和可靠性(competence),并验证其在不同数据模态、任务和模型架构中的有效性。实证表明,该方法能有效识别错误预测,且新型OOD检测器在准确率和FPR95TPR上显著优于现有方法。
摘要
对于机器学习分类而言,定量的特征描述和不确定性估计至关重要,尤其是在安全至关重要的场景中,这些场景要求进行连续的实时监控,并且需要可解释且可靠的评分结果。依赖最大后验概率原则来确定标签分类可能会掩盖标签分配的确定性。我们构建了一个基于预测概率估计的确定性及能力量化评分的理论框架,正式证明了这些框架的属性,并通过实证验证了它们在不同数据类型、任务和模型架构下的推理能力。我们的理论结果表明,在与训练数据和测试数据相似的输入条件下,性能良好的模型对真正例和假正例的确定性分布具有明显差异;该框架为评估模型预测的质量和检测假正例提供了可靠的方法。实证结果进一步证实,在训练数据、保留数据以及事先属于异常分布的数据上,确定性评分的分布也存在显著差异。对于“专家级”模型,当使用最低5%的TP阈值作为划分标准时,至少可以识别出62.1%的假正例。此外,我们发现EnergyBased异常检测器(EnergyBased OOD detectors)的实证能力与其FPR95TPR率之间存在强烈的负相关关系。最后,我们开发了两种形式的异常检测器,这两种检测器能够可靠地区分属于同一分布的数据和异常分布的数据,其性能平均优于现有的最先进方法;与基线蒙特卡洛Dropout AUPR-OUT方法相比,它们的性能分别提升了14.4%和16.5%,同时将FPR95TPR降低了54.2%和37.6%。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号