用于脑部磁共振成像(MRI)的解剖学基础模型

《Pattern Recognition》:Anatomical foundation models for brain MRIs

【字体: 时间:2025年11月16日 来源:Pattern Recognition 7.6

编辑推荐:

  脑解剖特征与年龄联合的弱对比学习框架AnatCL在神经影像任务中表现优异,通过整合皮质厚度、灰质体积等解剖指标与年龄信息构建鲁棒表征空间,在阿尔茨海默病、自闭症、精神分裂症等12项下游任务及10项临床评分预测中均达到最优或次优结果。

  ### 深度学习在神经影像学中的应用与AnatCL模型

神经影像学是现代医学研究中的重要领域,通过磁共振成像(MRI)等技术获取大脑结构和功能的信息,为多种神经疾病和神经退行性疾病的诊断与理解提供了强有力的支持。近年来,深度学习(Deep Learning, DL)在这一领域中的应用日益增多,尤其是在疾病检测和预测方面展现出巨大的潜力。然而,神经影像数据具有高度的复杂性和高维特性,使得其自动化分析面临诸多挑战。传统的机器学习方法通常依赖于大量手动标注的数据,这不仅耗时且成本高昂。为了克服这些挑战,研究人员开始探索弱监督学习(weakly supervised learning)和自监督学习(self-supervised learning)等技术,这些方法能够在较少标注的情况下提取数据中的有用信息。

其中,对比学习(contrastive learning)因其在复杂数据处理中的强大能力,成为当前研究的热点。对比学习的核心思想是通过拉近相似样本之间的距离,同时推开不相似样本之间的距离,来学习更具判别性的特征表示。近年来,一些研究将对比学习应用于脑年龄预测,如y-Aware和ExpW等方法,它们通过结合患者年龄这一连续特征来优化学习过程。然而,这些方法主要依赖于单一的年龄特征,忽略了大脑结构中丰富的解剖信息。因此,本文提出了一种新的对比学习框架——AnatCL,该框架不仅考虑了年龄,还引入了解剖特征,如皮层厚度(cortical thickness, CT)、灰质体积(gray matter volume, GMV)和表面积(surface area, SA),从而提升了模型在多个下游任务中的表现。

### AnatCL模型的核心思想

AnatCL是一种基于解剖信息的对比学习框架,旨在利用结构MRI数据中的解剖特征,构建更鲁棒和可迁移的特征表示。传统的对比学习方法通常使用患者年龄作为元数据,通过相似性度量来引导学习过程。然而,这种单一的元数据可能不足以全面反映大脑的结构特征。因此,AnatCL引入了多种解剖特征,以增强模型对大脑结构信息的捕捉能力。

为了实现这一目标,AnatCL提出了两种不同的对比学习方法:局部版本(local version)和全局版本(global version)。局部版本主要关注特定解剖区域(region of interest, ROI)之间的相似性,而全局版本则考虑整个大脑的解剖特征。这两种方法分别通过不同的方式计算样本之间的相似性,以适应不同的任务需求。局部版本通过计算不同ROI之间的相似性来捕捉局部解剖特征,而全局版本则通过综合整个大脑的解剖特征,提供更全面的特征表示。

### 解剖特征的选取与处理

在AnatCL中,解剖特征的选择是关键。本文选择了CT、GMV和SA作为主要的解剖特征,这些特征可以通过标准工具如FreeSurfer直接从结构MRI数据中提取。这些特征不仅具有生物学意义,而且在其他研究中也被证明具有较高的预测价值。例如,CT可以反映大脑皮层的厚度变化,GMV可以指示灰质的总体积,而SA则与大脑表面的复杂性相关。通过将这些解剖特征与年龄信息结合,AnatCL能够更全面地捕捉大脑结构的特征,从而提升模型的泛化能力和预测性能。

此外,为了进一步验证这些解剖特征的有效性,本文还比较了使用所有七种解剖特征的情况,结果表明并非所有特征都能对模型性能产生同等影响。通过选择特定的解剖特征,AnatCL在多个任务中实现了更稳定和准确的嵌入表示。这说明在解剖特征的选择上,存在一定的优化空间,可以通过进一步的研究来探索哪些特征对特定任务最为关键。

### 实验设计与数据准备

为了验证AnatCL的有效性,本文在多个公开数据集上进行了广泛的实验,包括OpenBHB、ADNI、OASIS-3、SchizConnect和ABIDE I等。这些数据集涵盖了不同的神经疾病和精神障碍,如阿尔茨海默病(Alzheimer’s Disease, AD)、精神分裂症(Schizophrenia, SCZ)、自闭症谱系障碍(Autism Spectrum Disorder, ASD)等。实验中,所有的MRI图像均经过标准化的VBM预处理,包括非线性配准到MNI模板和灰质提取。最终的图像空间分辨率为1.5 mm,尺寸为121×145×121。

在预处理完成后,本文对每个样本提取了CT、GMV和SA等解剖特征,并将这些特征作为模型训练的一部分。为了确保实验的严谨性,本文采用了五折交叉验证,并在每个折中评估模型的性能。所有数据划分均在个体层面进行,以避免数据泄露(leakage)。

### 实验结果与分析

在实验中,AnatCL在多个下游任务中表现出色,尤其是在脑年龄预测和性别分类方面,取得了最低的绝对误差(mean absolute error, MAE)和最高的平衡准确率(balanced accuracy)。在精神疾病分类任务中,如精神分裂症和自闭症谱系障碍的检测,AnatCL也达到了最先进的性能。特别是在PDD-NOS(泛发性发育障碍未明确)患者的检测中,AnatCL显著提高了准确性。

此外,AnatCL在临床评估评分的预测任务中也表现出色。这些评分包括异常不自主运动量表(AIMS)的总体评分、抑郁评分、手性信息以及步态评分(GAIT)。虽然大多数研究集中在功能性MRI(fMRI)数据上,但本文表明,通过结构MRI数据,AnatCL能够有效地预测这些临床评分。这不仅有助于理解大脑结构与个体表型之间的关系,还可能为未来发现新的生物标志物提供依据。

### 数据增强的影响

在实验中,还评估了数据增强对模型性能的影响。通过引入随机裁剪和切割(random cropping and cutout)等数据增强技术,本文发现这些技术对模型性能的提升有限,这与之前在VBM数据上的研究结果一致。这表明在结构MRI数据的处理中,数据增强的必要性可能不如在功能性MRI数据中那么显著。

### 超参数的敏感性分析

为了进一步优化模型性能,本文还分析了超参数对模型表现的影响。特别是对权重参数λ1和λ2的敏感性进行了研究。λ1控制解剖特征对模型学习的贡献,而λ2则控制年龄信息的贡献。实验结果表明,同时利用解剖特征和年龄信息的联合监督方式能够显著提升模型的性能。相比之下,单独使用年龄或解剖信息的模型表现较差,这说明解剖特征与年龄信息的结合是提高模型泛化能力的关键。

### 模型的可迁移性

AnatCL的一个重要特点是其可迁移性(transferability)。通过在健康样本上进行预训练,模型可以迁移到多个下游任务,如疾病的检测和临床评分的预测。这种预训练-迁移学习(pre-training and transfer learning)的策略使得AnatCL在多个数据集上都表现良好,证明了其在不同任务中的通用性。这不仅减少了对特定任务数据的需求,还降低了模型训练的成本和复杂度。

### 未来工作与应用前景

尽管AnatCL在多个任务中取得了显著的成果,但仍有进一步优化的空间。例如,可以探索更多的解剖特征,或者引入其他类型的监督信号来增强模型的表达能力。此外,模型的可解释性也是未来研究的一个重要方向,通过分析模型在不同任务中的表现,可以更好地理解大脑结构与疾病之间的关系。

AnatCL的应用前景广阔,不仅限于疾病检测,还可以用于临床评估、个性化医疗以及神经科学研究等多个领域。通过结合解剖特征和年龄信息,AnatCL为构建更鲁棒和可迁移的特征表示提供了新的思路。未来的研究可以进一步探索如何将AnatCL应用于更复杂的任务,如多模态数据融合、多任务学习等,以提升其在实际应用中的效果。

### 结论

本文提出的AnatCL模型通过结合解剖特征和年龄信息,构建了一种新的对比学习框架,显著提升了在多个下游任务中的表现。实验结果表明,AnatCL在脑年龄预测、性别分类、精神疾病检测和临床评分预测等方面均优于传统的对比学习方法。这一成果不仅为神经影像学的自动化分析提供了新的工具,也为未来的研究和应用开辟了新的方向。通过进一步优化解剖特征的选择和模型结构,AnatCL有望在更多任务中发挥重要作用,推动神经影像学领域的技术进步和临床应用。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号