
-
生物通官微
陪你抓住生命科技
跳动的脉搏
FairBias:融合混合噪声与类别不平衡处理的医学影像诊断偏倚缓解框架
【字体: 大 中 小 】 时间:2025年07月03日 来源:Neurocomputing 5.5
编辑推荐:
医学影像诊断中,类别不平衡和混合噪声导致深度学习模型存在偏倚和性能下降。研究人员提出FairBias框架,通过类感知样本分离(Class-Aware Sample Separation)、动态类别重加权(Dynamic Class Reweighting)等技术,将多数类与少数类的真阳性率(TPR)差距从15%降至5%,并在CheXpert等数据集上实现AUC>0.95。该研究为AI医疗诊断的公平性与鲁棒性提供了新范式。
在AI驱动的医疗影像诊断领域,一个长期存在的矛盾日益凸显:尽管深度学习模型在理想条件下表现优异,但现实中的类别不平衡(Class Imbalance)和混合噪声(Mixed Noise)问题——包括标签错误(Mis-Labeled)和低质量样本(Low-Quality Samples)——导致模型对少数类(如罕见疾病)的诊断性能显著下降。以CheXpert数据集为例,某些罕见病类的样本占比不足5%,而 Breast MRI/FFDM 数据集中恶性病例的稀缺性进一步加剧了诊断偏倚。更棘手的是,现有方法如QMix虽能处理噪声,却难以同步解决类别不平衡,导致少数类患者的真阳性率(True Positive Rate, TPR)比多数类低15%以上,可能延误治疗时机。
针对这一挑战,深圳大学的研究团队开发了FairBias框架。该研究通过四项核心技术突破:基于高斯混合模型(Gaussian Mixture Model, GMM)的类感知样本分离技术,将数据分为正确标注、高质误标(MHQS)和低质误标(MLQS)三类;动态调整类别权重的偏倚感知损失函数(Bias-Aware Loss);针对少数类的生成对抗网络(GAN)数据增强;以及融合亚组分析的多任务学习(Multi-Task Learning)。实验表明,在含55% MLQS和20% MHQS的Hep-2数据集上,FairBias的Kappa分数达88.5%,远超QMix等基线模型。
类感知样本分离
通过EM算法优化GMM参数,模型能准确识别不同质量样本。在CheXpert数据集中,该方法将MLQS样本的分离AUC提升至97.6%,为后续处理奠定基础。
动态类别重加权
采用逆类别频率加权策略,调整损失函数中少数类的贡献度。结果显示,乳腺癌MRI数据的Equal Opportunity(EO)差异从12%缩小至3%。
多任务公平性学习
通过联合优化分类任务和亚组预测任务,模型在SOKL数据集上将 Demographic Parity(DP)差异控制在2%以内,显著优于vlm-fairness等对比模型。
噪声鲁棒性验证
在80%高噪声比例下,FairBias仍保持0.92的AUC-PR(Precision-Recall曲线下面积),证明其对标签错误的耐受性。
这项发表于《Neurocomputing》的研究,首次系统性地整合了噪声处理与公平性优化。其临床意义在于:一方面,通过将罕见病类的TPR提升10个百分点,降低了漏诊风险;另一方面,Kappa分数在对称噪声条件下达89.4±2.0,为实时诊断系统提供了可靠性保障。不过,研究者也指出计算复杂度较高的问题——在Breast MRI/FFDM数据集上训练需200 GPU小时,这为后续轻量化改进指明了方向。
从方法论看,FairBias的创新性体现在三方面:其一,GMM与动态加权的协同机制,突破了传统方法对噪声和类别不平衡的孤立处理模式;其二,跨域对比学习(Cross-Domain Contrastive Learning)技术的引入,增强了模型对未见过模态的泛化能力;其三,首次将Equalized Odds(ED)等公平性指标纳入医学影像评估体系。正如通讯作者Saeed Iqbal所述,该框架“不仅填补了SOTA技术的空白,更重新定义了医疗AI的公平性标准”。未来工作将聚焦于降低计算成本,并探索在CT、超声等新模态中的应用潜力。
生物通微信公众号
知名企业招聘