
-
生物通官微
陪你抓住生命科技
跳动的脉搏
皮肤镜概念瓶颈模型中的概念不一致性:对Derm7pt数据集的粗糙集分析
《Scientific Reports》:Concept inconsistency in dermoscopic concept bottleneck models: a rough-set analysis of the Derm7pt dataset
【字体: 大 中 小 】 时间:2026年06月12日 来源:Scientific Reports 3.9
编辑推荐:
摘要概念瓶颈模型(CBMs)专注于通过基于临床的概念层进行黑色素瘤分类和路径预测,这种模型将可解释性与概念标签的一致性相结合。当数据集中存在概念层面的不一致性时,相同概念特征映射到相互冲突的诊断标签上,会形成无法解决的瓶颈,从而限制了可实现的准确率。在本文中,我们将粗糙集理论应用
概念瓶颈模型(CBMs)专注于通过基于临床的概念层进行黑色素瘤分类和路径预测,这种模型将可解释性与概念标签的一致性相结合。当数据集中存在概念层面的不一致性时,相同概念特征映射到相互冲突的诊断标签上,会形成无法解决的瓶颈,从而限制了可实现的准确率。在本文中,我们将粗糙集理论应用于Derm7pt皮肤镜基准测试,并首次全面描述了这种不一致性的范围和临床特征。在由7点黑色素瘤检查表中的皮肤镜标准形成的305个独特概念特征中,有50个(占16.4%)存在不一致性,涉及306张图像(占数据集的30.3%)。这意味着任何基于全部原始数据训练的硬性CBM的理论准确率上限为92.1%,因为超过一半的黑色素瘤图像具有属于边界区域的特征。这一不成比例的比例表明,这些检查表概念在区分黑色素瘤与非黑色素瘤病变方面的能力较弱。我们分析了冲突的严重程度分布,并确定了导致边界模糊的主要临床特征。提出了两种过滤策略来移除具有不一致概念特征的图像,这两种策略都产生了我们称之为Derm7pt+的基准测试结果。对称策略得到了一个完全一致的特征子集,包含705张图像;而不对称策略保留了所有黑色素瘤图像,仅移除了非黑色素瘤的对应图像,得到了841张图像。我们在Derm7pt+的两个变体上,使用来自EfficientNet、DenseNet、ResNet和Wide ResNet系列的19种骨干网络架构评估了硬性CBM的性能。在对称过滤条件下,DenseNet-169取得了最佳的测试宏F1分数\(0.80\pm 0.01\);而在不对称过滤条件下,EfficientNet-B4的表现更优,其测试宏F1分数为\(0.82\pm 0.01\)。尽管所有配置下的概念平均准确率处于中等水平但较为稳定,但这种概念预测能力足以产生可靠的标签宏F1分数。这表明,注释噪声而非骨干网络的容量才是影响瓶颈质量的关键因素。我们进一步应用了稀疏优化特征重要性(SOFI)解释器来分析在对称Derm7pt+上表现最佳的模型的阳性黑色素瘤预测结果。研究发现,不规则点状和球状结构是决定黑色素瘤预测的主要因素,而不规则条纹、非典型色素网络和呈现蓝白色覆盖层则构成了次要的预测依据。