综述:从大到小:通过迁移学习提升精准精神病学的新兴方法
《Biological Psychiatry Global Open Science》:From big to small: Emerging methods for enhancing precision psychiatry through transfer learning
【字体:
大
中
小
】
时间:2025年11月03日
来源:Biological Psychiatry Global Open Science 4.0
编辑推荐:
本综述系统阐述了迁移学习(Transfer Learning)在脑-行为预测模型中的应用,为核心精神病学(Precision Psychiatry)的发展提供了关键方法学支持。文章重点探讨了如何利用大规模神经影像数据集(如UK Biobank)预训练模型,并通过微调(Fine-tuning)等技术将其适应性应用于小样本临床数据,以提升对临床症状、认知功能及治疗结局预测的准确性与泛化能力。文中详述了目标特异性模型与目标不可知模型(如基础模型Foundation Models)两大技术路径,并以元匹配(Meta-matching)等实例说明了其显著提升预测效能(最高达567%)的潜力。同时,综述强调了可解释人工智能(XAI)对于推动机制理解和临床转化的重要性,为利用复杂高维数据揭示精神疾病异质性机制指明了方向。
引言:精准精神病学的挑战与机遇
精准精神病学强调个体差异而非群体平均水平,其核心目标在于识别神经生物学特征与症状谱或治疗结果之间可靠的联系。脑-行为预测模型已成为阐明认知功能和复杂临床现象背后神经机制的有力工具。然而,这些方法在临床环境中的广泛应用,常因单个患者群体可用的神经影像和临床数据量有限而受阻。迁移学习——一种在机器学习和深度学习中广泛采用的策略,旨在从复杂的高维数据集中提取可泛化和可迁移的关联——为此提供了一个充满前景的解决方案。
何为迁移学习?
迁移学习的核心思想类比于人类学习:一位有丰富单板滑雪经验的个体,在学习 downhill 滑雪或冲浪等相关运动技能时,会比没有经验的个体更容易上手,因为不同运动间共享了某些身体和感知运动过程。在机器学习中,迁移学习使得模型能够将在源任务(如在大规模数据集上预测冲动性)中学到的“知识”迁移应用于新的相关任务(如在小型临床数据集上预测持续注意力或抑郁治疗反应)。
其首要优势在于效率和适应性。在临床神经影像环境中,数据可用性常常受限,迁移学习无需从头训练新模型,而是对预训练模型进行微调,既保留了基础表征,又适应了更具体的预测任务。成功迁移的关键条件在于源任务与目标任务之间的相关性,以及预训练期间所学特征的鲁棒性。
迁移学习的分类与实践
根据学习范式和领域相似性,迁移学习可系统分类为归纳式、直推式和无监督学习等。在神经影像脑-行为建模的当前实践中,主要可分为两大类:
这类模型主要基于归纳式迁移学习,旨在通过利用源任务和领域的知识,来提高在相关但不同的目标任务中的预测性能。例如,利用在大型非临床数据集(如人脑连接组计划HCP)上训练的预测智商的模型,来预测小型临床队列的执行功能。多任务学习和任务嵌入模型是更具结构化的框架,它们通过共享特征提取器或将任务定位在共享的潜在相似性空间中,来指导迁移。然而,当任务相关性弱或领域分布差异显著时,可能出现“负迁移”。域适应技术,如相关性对齐(CORAL)、最大均值差异(MMD)等,可用于减少数据集间的差异影响。
基础模型是在大规模数据集上(通常通过自监督学习)训练的模型,可适应广泛的下游任务。在神经科学中,功能磁共振成像(fMRI)因其高维和信息丰富的特性,已成为大脑基础模型的主要数据源。早期模型如脑网络转换器(Brain Network Transformer)整合了基于连接组的图表示。近期模型如BrainLM、Brain-JEPA和NeuroSTORM等,展示了将自监督学习应用于大规模fMRI数据的潜力,它们学习鲁棒的潜在表征,能揭示大脑活动与不同认知状态之间的结构化关联。
迁移学习的适应策略
将预训练模型有效部署到神经影像任务中,适应是关键步骤。主要策略包括:
- 1.冻结特征提取:将预训练模型视为静态编码器,仅训练顶层的浅层分类器或回归器。计算高效,过拟合风险低,但适应性较差,适用于目标任务与源任务高度相似的情况。
- 2.微调:允许模型根据下游数据更新其参数,包括全微调和部分微调。灵活性更高,但需要谨慎进行,以避免在数据量小或标签噪声大的情况下过拟合,或破坏已学到的表征结构。
- 3.模块化适应:在冻结的主干网络中插入小型可训练模块(如适配器Adapter、LoRA、提示调优Prompt Tuning)。这些方法参数效率高,支持多任务迁移和跨队列/站点的域适应,非常适合神经影像应用。
实例解析:元匹配
元匹配是迁移学习在脑-行为预测建模中的一个具体而灵活的应用实例。其基本假设是许多行为表型之间存在相关性,因此,在一个数据集上预测某种表型Y的模型,可以经过调整用于预测另一个数据集中不同的表型X。
元匹配结合了迁移学习、多任务学习和元学习的元素。首先,在包含多种表型的大型“元集”(如UK Biobank, N=36,848)上训练一个大型脑-行为模型。然后,将该预训练模型应用于新数据集(如HCP-YA)的一部分,生成对相同表型的预测。如果预测的表型(如冲动性)与新数据集中的目标结局(如治疗反应)存在显著关联,则可以使用少量标记数据(如100个样本,即100-shot学习)对模型进行微调,以进一步提高预测性能。研究表明,元匹配能显著提升预测性能,在临床队列中准确预测认知功能,即使在不同患者群体、扫描站点和测量工具间也表现出良好的泛化能力。
实践考量与可解释性
在实际应用中,迁移学习需考虑数据集异质性(如成像协议、人口统计学、用药状态的差异)带来的挑战,这要求仔细的数据协调和混杂因素控制。此外,可解释人工智能(XAI)对于建立科学理解和临床信任至关重要。XAI方法,如基于扰动的方法(如虚拟损伤)、内在可解释模型(如线性模型、注意力权重)以及事后解释方法(如SHAP),有助于揭示模型的决策依据,识别对预测最重要的神经特征,从而推动对潜在神经生物学机制的理解。
结论
迁移学习架起了大规模群体数据集与小规模精细临床数据集之间的重要桥梁。通过利用从广泛、异质样本中学到的知识,并将其应用于更有针对性的临床人群,迁移学习增强了构建精细化、可泛化模型的能力,这些模型支持精神病学研究和未来实践中实现个性化、精准化的预测。随着可解释性、公平性、鲁棒性等问题的持续探索,迁移学习与多模态学习等前沿方向的结合,有望深化我们对复杂脑-行为关系的理解,并最终推动针对个体差异的、基于机制的精神疾病诊疗策略的发展。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号