针对阿尔茨海默病检测的领域特定迁移学习与分类器链:基于3D卷积神经网络的应用

《Informatics in Medicine Unlocked》:Domain Specific Transfer Learning and Classifier Chains in Alzheimer’s Disease Detection using 3D Convolutional Neural Networks

【字体: 时间:2025年11月09日 来源:Informatics in Medicine Unlocked CS9.5

编辑推荐:

  本研究通过对比二分类与多分类模型,并采用分类器链策略,评估了Med3D领域特定迁移学习在阿尔茨海默病与轻度认知障碍分类中的应用。实验表明,分类器链A在96%准确率下优于现有方法,但迁移学习普遍导致性能下降达55%,揭示迁移学习的适用条件需进一步研究。

  在当今社会,阿尔茨海默病(Alzheimer’s Disease, AD)已成为全球范围内影响老年人健康的重要疾病之一。随着人口老龄化趋势的加剧,AD的早期诊断和干预显得尤为重要。神经退行性疾病通常会导致认知功能的逐渐衰退,而AD则是最常见的类型之一,占所有痴呆病例的60%-80%。然而,目前尚无能够逆转AD症状或彻底治愈该疾病的药物。因此,准确、高效的AD诊断方法成为研究的热点。为了应对这一挑战,研究人员不断探索新的技术手段,其中人工智能(Artificial Intelligence, AI)和深度学习(Deep Learning)技术在医学影像分析中展现出巨大的潜力。

本研究围绕深度卷积神经网络(Deep Convolutional Neural Networks, CNNs)的不同配置,以及在区分AD、轻度认知障碍(Mild Cognitive Impairment, MCI)和正常认知(Cognitively Normal, CN)个体时,是否可以借助领域特定的迁移学习(Transfer Learning)技术来提升模型的性能。研究数据来源于阿尔茨海默病神经影像学倡议(Alzheimer’s Disease Neuroimaging Initiative, ADNI)数据库,共包含了1,118例3D氟脱氧葡萄糖正电子发射断层扫描(FDG-PET)图像,涵盖了AD、LMCI、MCI、EMCI和CN等不同状态的患者。这些数据经过严格的预处理,包括图像格式转换、脑组织提取、空间归一化、图像裁剪、尺寸调整以及强度归一化,以确保输入数据的一致性和可比性。

研究团队采用ResNet34作为基础模型,并结合PyTorch和PyTorch Lightning框架进行实现。ResNet34是一种广泛使用的深度CNN结构,因其在保持模型深度的同时,通过残差连接有效降低了复杂度,而被选为本研究的核心模型。此外,研究还引入了Med3D提供的领域特定预训练权重,该权重基于8种不同的医学分割数据集进行训练,包括大脑、心脏、脾脏等器官的图像。尽管Med3D主要用于分割任务,但其权重也被用于分类任务,从而为本研究提供了可能的性能提升途径。

研究设计了两种不同的二分类器链(Classifier Chains)配置,分别以不同的顺序进行分类。链A首先对正常认知(CN)与非正常认知(non-CN)进行分类,随后对AD与MCI进行区分;而链B则先对AD与非AD进行分类,再对CN与MCI进行区分。通过比较这些链式结构的性能,研究试图验证是否可以通过将多个二分类器组合起来,实现更准确的多类分类任务。同时,研究还对比了二分类与多分类模型的性能,以回答关于二分类是否优于多分类的问题。

实验结果显示,二分类模型在没有使用领域特定迁移学习的情况下,达到了99%的准确率、99%的F1分数和100%的AUROC(Area Under the Receiver Operating Characteristic Curve),远超其他模型。相比之下,多分类模型(如MC1和MC2)的性能略逊一筹,尽管在某些情况下仍能接近或达到较高的准确率和F1分数。值得注意的是,当引入Med3D的预训练权重时,大多数模型的性能出现下降,其中MC2模型的F1分数下降了64%,准确率从93%降至55%,AUROC从99%降至34%。这表明领域特定迁移学习在某些情况下可能并不总是带来性能的提升,甚至可能对模型造成负面影响。

在对二分类器链的评估中,链A的平均准确率为96%,F1分数为95%,AUROC为99%,而链B的平均准确率为88%,F1分数为83%,AUROC为99%。尽管链B的AUROC表现较好,但其准确率和F1分数明显低于链A。这说明二分类器链的顺序对最终分类结果具有重要影响,而链A的分类顺序可能更符合大脑代谢特征的分布规律。例如,MCI病例在某些方面可能与CN病例更为相似,而与AD病例存在较大差异,因此先区分CN与非CN,再区分AD与MCI的顺序可能有助于提高分类的准确性。

为了确保模型的鲁棒性,研究团队还进行了扰动分析(Perturbation Analysis)。该分析通过随机打乱标签,评估模型在面对噪声数据时的表现。结果显示,所有模型在标签被扰动后,其性能显著下降,接近随机猜测的水平。这表明模型并未过度依赖训练数据,而是能够识别出与类别相关的实际特征。这一发现对模型的实际应用具有重要意义,意味着它们在面对新数据时具备一定的泛化能力。

研究进一步探讨了迁移学习在医学影像分类中的适用性。尽管迁移学习在许多领域中已被证明可以显著提升模型性能,但在本研究中,使用领域特定预训练权重并未带来预期的提升,反而在部分模型中导致性能下降。这一现象可能与数据的相似性有关。尽管Med3D是在医学影像数据上训练的,但其训练数据与本研究使用的FDG-PET图像之间仍存在一定的差异,导致预训练权重无法有效迁移到当前任务中。因此,研究认为,迁移学习的效果不仅取决于领域的一致性,还可能受到数据相似性的直接影响。

此外,研究还指出,当前的ADNI数据集存在类别不平衡的问题。为了应对这一挑战,研究团队采用了加权随机采样(Weighted Random Sampler)的方法,确保在训练过程中各个类别的样本数量趋于均衡。这一策略有助于提高模型的泛化能力,避免因样本数量差异导致的偏差。然而,研究也指出,一个完全平衡的数据集可能会使分类任务更容易实现,因此未来的研究可以进一步探索这一方向。

在讨论部分,研究团队认为二分类器链在某些情况下可能比传统的多分类模型更具优势。例如,链A的分类顺序可能更符合实际病理特征,使得模型在处理复杂任务时能够更高效地提取特征。然而,链B的性能表现则相对较低,这可能与其分类顺序有关。因此,研究建议在设计二分类器链时,应充分考虑分类任务的复杂性和类别之间的相似性,以优化模型的整体表现。

研究的局限性在于,目前只能使用Med3D提供的领域特定预训练权重,而无法获得更精确的、专门针对FDG-PET图像的预训练模型。因此,未来的研究可以尝试使用更具体的预训练权重,以进一步提升模型的性能。此外,研究团队还计划探索更多的二分类器链配置,以及结合集成学习(Ensemble Learning)和正则化技术(如Dropout)来增强模型的鲁棒性和准确性。

总的来说,本研究通过对比不同类型的CNN模型,揭示了二分类器链在多类分类任务中的潜力,同时也指出了领域特定迁移学习在某些情况下可能存在的局限性。研究结果表明,二分类器链能够有效提升模型的分类性能,而领域特定迁移学习的效果则取决于数据的相似性和模型的适配性。这些发现不仅为AD和MCI的自动分类提供了新的思路,也为医学影像分析中的迁移学习应用提供了重要的参考。未来的研究可以进一步探索如何优化迁移学习策略,以更好地适应医学影像分类任务,从而推动AI在临床诊断中的实际应用。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号