皮肤镜概念瓶颈模型中的概念不一致性：对Derm7pt数据集的粗糙集分析

首页今日动态人才市场新技术专栏中国科学人云展台
BioHot
云讲堂直播会展中心特价专栏技术快讯免费试用

生物通官微
陪你抓住生命科技
跳动的脉搏

生物通首页 > 今日动态 > 正文

《Scientific Reports》：Concept inconsistency in dermoscopic concept bottleneck models: a rough-set analysis of the Derm7pt dataset

【字体：大中小】 时间：2026年06月12日 来源：Scientific Reports 3.9

编辑推荐：

　　摘要概念瓶颈模型（CBMs）专注于通过基于临床的概念层进行黑色素瘤分类和路径预测，这种模型将可解释性与概念标签的一致性相结合。当数据集中存在概念层面的不一致性时，相同概念特征映射到相互冲突的诊断标签上，会形成无法解决的瓶颈，从而限制了可实现的准确率。在本文中，我们将粗糙集理论应用

摘要

概念瓶颈模型（CBMs）专注于通过基于临床的概念层进行黑色素瘤分类和路径预测，这种模型将可解释性与概念标签的一致性相结合。当数据集中存在概念层面的不一致性时，相同概念特征映射到相互冲突的诊断标签上，会形成无法解决的瓶颈，从而限制了可实现的准确率。在本文中，我们将粗糙集理论应用于Derm7pt皮肤镜基准测试，并首次全面描述了这种不一致性的范围和临床特征。在由7点黑色素瘤检查表中的皮肤镜标准形成的305个独特概念特征中，有50个（占16.4%）存在不一致性，涉及306张图像（占数据集的30.3%）。这意味着任何基于全部原始数据训练的硬性CBM的理论准确率上限为92.1%，因为超过一半的黑色素瘤图像具有属于边界区域的特征。这一不成比例的比例表明，这些检查表概念在区分黑色素瘤与非黑色素瘤病变方面的能力较弱。我们分析了冲突的严重程度分布，并确定了导致边界模糊的主要临床特征。提出了两种过滤策略来移除具有不一致概念特征的图像，这两种策略都产生了我们称之为Derm7pt+的基准测试结果。对称策略得到了一个完全一致的特征子集，包含705张图像；而不对称策略保留了所有黑色素瘤图像，仅移除了非黑色素瘤的对应图像，得到了841张图像。我们在Derm7pt+的两个变体上，使用来自EfficientNet、DenseNet、ResNet和Wide ResNet系列的19种骨干网络架构评估了硬性CBM的性能。在对称过滤条件下，DenseNet-169取得了最佳的测试宏F1分数\(0.80\pm 0.01\)；而在不对称过滤条件下，EfficientNet-B4的表现更优，其测试宏F1分数为\(0.82\pm 0.01\)。尽管所有配置下的概念平均准确率处于中等水平但较为稳定，但这种概念预测能力足以产生可靠的标签宏F1分数。这表明，注释噪声而非骨干网络的容量才是影响瓶颈质量的关键因素。我们进一步应用了稀疏优化特征重要性（SOFI）解释器来分析在对称Derm7pt+上表现最佳的模型的阳性黑色素瘤预测结果。研究发现，不规则点状和球状结构是决定黑色素瘤预测的主要因素，而不规则条纹、非典型色素网络和呈现蓝白色覆盖层则构成了次要的预测依据。

联系信箱：

粤ICP备09063491号

摘要

热点排行