
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于自编码器框架的多中心fMRI数据去站点变异研究:提升机器学习模型泛化能力的新策略
【字体: 大 中 小 】 时间:2025年09月03日 来源:Neuroinformatics 3.1
编辑推荐:
来自某研究团队的研究人员针对多中心功能磁共振成像(fMRI)数据存在的站点特异性变异问题,创新性地提出采用自编码器(AE)框架进行数据协调。该研究通过AE的非线性表征学习能力,在保留生物特征的同时有效消除站点差异,在ABIDE-I数据集(17个中心1035例)上实现LOSO交叉验证准确率显著提升3.41%-5.04%(p<0.01),为神经影像分析的可靠性提供了新解决方案。
消除多中心功能磁共振成像(fMRI)数据的站点特异性变异,是提升机器学习模型泛化能力的关键挑战。传统协调方法如ComBat依赖线性校正因子,难以捕捉扫描设备、采集协议与信号变异间的非线性相互作用,且存在数据泄露风险。这项研究开创性地运用自编码器(AE)框架,包括标准AE、稀疏AE(SAE)、去噪AE(DAE)等变体,通过其强大的非线性特征提取能力,在消除站点效应的同时保留神经生物学特征。基于自闭症脑影像数据交换计划(ABIDE-I)17个中心1035例样本的验证显示,所有AE模型在留一站点交叉验证(LOSO)中均显著优于基线(p<0.01),平均准确率提升达3.41%-5.04%。该技术显著降低了传统方法的数据泄露风险,为阿尔茨海默病、自闭症谱系障碍等神经精神疾病的跨中心研究提供了可靠分析工具。研究代码已开源共享。
生物通微信公众号
知名企业招聘