通道均衡化：基于公平通道增强模块的类别不平衡感知皮肤疾病识别

首页今日动态人才市场新技术专栏中国科学人云展台
BioHot
云讲堂直播会展中心特价专栏技术快讯免费试用

生物通官微
陪你抓住生命科技
跳动的脉搏

生物通首页 > 今日动态 > 正文

《IEEE Access》：Channeling Fairness: Class Imbalance-Aware Skin Disease Recognition via Fair Channel Enhancement Module

【字体：大中小】 时间：2026年03月03日 来源：IEEE Access 3.6

编辑推荐：

　　本研究针对皮肤疾病分类中普遍存在的类别不平衡、类间相似性高、类内差异性大等难题，提出了一种名为“公平通道增强（FCE）”的创新模块。该模块无需额外标注或复杂架构，通过依据类别频率按比例分配特征通道，显著提升了对低频类别的表征公平性与模型识别性能。结合CutMix数据增强与标签平滑技术，框架在多个皮肤科基准数据集上表现优异，最高实现7.13%的准确率提升，为不平衡分类问题提供了简洁高效的解决方案。

皮肤，作为人体最大的器官，其健康状况是大众关注的焦点。然而，皮肤疾病的诊断却充满了挑战。据估计，全球有约30亿人正受各种皮肤问题的困扰。传统的诊断依赖皮肤科医生的人工检查，不仅耗时费力，其准确性也因皮肤疾病种类繁多、外观多变而受到影响。同一个疾病在不同患者身上可能呈现截然不同的样貌（高类内变异），而不同的疾病有时看起来又惊人地相似（低类间差异）。这为开发自动化、高精度的皮肤疾病辅助诊断系统带来了巨大困难。

雪上加霜的是，现实世界中的医疗数据常常存在严重的“偏科”现象——即类别不平衡。像湿疹、痤疮这类常见病，在数据集中样本成百上千；而一些罕见皮肤病，则仅有寥寥数个样本。当利用这些不平衡数据训练人工智能（AI）模型时，模型会自然地“偏爱”样本多的常见病，导致对罕见病的识别能力极差，这对于那些恰好罹患罕见病的患者而言，无疑是灾难性的。尽管已有研究尝试通过重采样、集成学习、注意力机制等方式提升模型性能，但其在解决类别不平衡、提取细粒度特征方面仍显不足，在主流皮肤疾病数据集（如SD系列）上的准确率长期徘徊在50%-65%之间，难以满足实际应用需求。

为此，一篇发表在《IEEE Access》期刊上的研究，为我们带来了一个新颖的思路。研究者们没有选择在模型结构上“大动干戈”，增加复杂的子网络，而是巧妙地设计了一个名为“公平通道增强（Fair Channel Enhancement, FCE）”的模块，从特征通道的分配机制入手，试图让模型“看见”并重视那些样本稀少的疾病。

为了回答上述挑战，研究人员构建了一个包含FCE模块的分类框架。该框架的核心思路是“按需分配，聚焦重点”。首先，他们利用CutMix数据增强技术对输入图像进行混合，生成多样化的训练样本，提升模型鲁棒性。图像随后经由一个CNN主干网络（如ResNet50, DenseNet169, EfficientNet-v2-M）提取特征图。这些特征图被同时送入两个并行分支：一个是常规的全连接层，另一个则是本文提出的FCE模块。FCE模块的创新之处在于，它会根据每个类别的样本数量，按反比例将总的特征通道分配给各个类别——样本越少的罕见病，分配到的特征通道反而越多。这就像是为每个疾病类别配备了专属的“侦察兵”，罕见病由于线索（样本）少，反而需要更多的“侦察兵”去仔细搜寻和记忆其关键特征。分配完成后，还会对每个类别分配到的通道进行随机掩码（Channel Masking），迫使模型学习更鲁棒、更具判别性的特征。接着，通过跨通道最大池化和全局平均池化，最终得到每个类别的得分。两个分支分别计算带有标签平滑（Label Smoothing）的交叉熵损失，并按一定权重相加，共同指导模型训练。在推理阶段，则仅使用全连接层分支进行预测。研究使用了SD-128、SD-198、SD-260这三个皮肤疾病临床图像数据集，以及ISIC 2018（皮肤镜图像）和Hyper-Kvasir（胃肠道图像）等外部医学数据集进行验证。所有实验均基于PyTorch实现，并采用了多种基线模型进行对比。

研究结果

•
数据集分析揭示了核心挑战：研究首先对所用数据集进行了可视化分析。结果显示，SD-260等数据集存在严重的类别不平衡，样本最多的类别与最少的类别数量比高达243:1，这真实反映了临床数据的分布。同时，通过对模型错误分类的分析和图片对比，研究直观地展示了皮肤疾病存在的“低类间差异”和“高类内变异”问题，例如特应性皮炎（Atopic Dermatitis）的样本常被误认为其他多种皮炎，而其自身样本的外观也存在很大差异。这解释了模型性能瓶颈的部分根源。
•
在SD系列数据集上取得显著性能提升：在主要的皮肤疾病分类任务中，集成了FCE模块的模型全面超越了所有基线模型和最先进的方法。其中，EfficientNet-v2-M结合FCE模块表现最佳。在最具挑战性的SD-260数据集（50-50划分）上，相较于基线版本，其准确率和平衡准确率分别提升了6.44%和8.80%；相较于表现最好的基线模型ConvNeXt-Base，也分别领先1.41%和7.82%。类似的优势在其他数据集和划分方式下也得到一致体现。ResNet50和DenseNet169结合FCE后，性能也有大幅提升。
•
FCE模块有效缓解类别不平衡：通过分析高、低频类别（以平均样本数为界）的平均准确率，研究发现基线模型在低频类别上表现显著差于高频类别。而引入FCE模块后，模型在低频和高频类别上的性能均得到提升。例如，EfficientNet-v2-M结合FCE在SD-260数据集上，将低频和高频类别的平均准确率分别提升了8.60%和7.49%。这表明FCE模块通过分配更多特征通道给低频类别，确实增强了对它们的表征能力，且并未损害对高频类别的识别。
•
超越传统采样方法，计算代价低：与过采样、欠采样等传统处理类别不平衡的方法相比，FCE框架取得了更高的分类准确率。更重要的是，FCE不增加任何可训练参数量，仅引入可忽略不计的计算开销（GFLOPs），是一种高效且无需修改原始数据分布的方法。
•
提升对困难样本的区分能力：研究专门构建了包含易混淆类别的子数据集进行测试。在这些视觉相似度高、分类难度大的子集上，配备了FCE模块的模型依然能够显著提升分类准确率和平衡准确率，证明了其增强模型细粒度特征辨别力的能力。
•
在外部医学数据集上展示泛化性：在Hyper-Kvasir（胃肠道图像）数据集上，DenseNet169结合FCE模块在平衡准确率、精确率和F1分数上均超越了现有的主动学习方法。在ISIC 2018（皮肤镜图像）数据集上，FCE模块也能提升基线模型的性能，尽管由于图像模态差异（临床vs.皮肤镜）和预处理步骤不同，其性能未超越针对该数据集专门优化的方法，但仍证明了模块的一定泛化能力。
•
消融研究验证各组件有效性：通过系统性地移除框架中的各个组件（FCE模块、CutMix、标签平滑、通道掩码、公平通道分配），并进行性能对比与梯度加权类激活图（Grad-CAM）可视化，研究证实了每个组件对最终性能的贡献。完整的框架能促使模型关注图像中更多、更分散的判别性区域，而移除任一组件都会导致注意力区域变得集中或减弱，并伴随性能下降，说明了整体设计的必要性。

结论与讨论

本研究成功提出并验证了“公平通道增强（FCE）”这一新颖模块。其核心贡献在于，创造性地从特征通道资源分配的角度，直接应对医学图像分类中的类别不平衡难题。FCE模块依据类别样本数量反比例分配特征通道，为样本稀少的类别提供了更强的表征支持，从而在不引入额外参数、不依赖复杂结构或数据重采样的前提下，有效提升了模型对全体类别（尤其是低频类别）的分类性能。

该研究的意义重大。首先，FCE模块设计简洁、易于集成，为处理广泛的类别不平衡分类问题提供了一个通用而高效的解决方案。其次，该框架在多个具有挑战性的皮肤疾病数据集上取得了领先的性能，推动了AI在皮肤科辅助诊断领域向更公平、更准确的方向发展。最后，其在其他医学图像数据集上的良好表现，暗示了该方法的潜在普适性，有望惠及更多的医学影像分析任务。

当然，研究也指出了当前方法的局限。例如，在面对样本数量极端稀少的类别时，性能提升仍然有限；对于不同于训练数据模态（如临床图像 vs. 皮肤镜图像）的任务，可能需要额外的适配。这些为未来的研究指明了方向，例如探索FCE与更强数据增强的结合，或针对不同影像模态进行优化。总体而言，这项研究为解决医疗AI中的公平性与准确性问题，提供了一条颇具启发性的技术路径。

热点排行

新闻专题

联系信箱：

粤ICP备09063491号