迈向精神健康研究的协作数据科学:ECNP神经影像网络可访问数据仓库的建立与应用

【字体: 时间:2025年06月16日 来源:Neuroscience Applied CS1.3

编辑推荐:

  针对精神病学分类系统缺乏生物学依据的现状,欧洲神经精神药理学学院(ECNP)神经影像网络建立了多中心、多模态、跨诊断的数据仓库ECNP-NNADR,整合21个队列4829名参与者的神经影像和临床数据。通过支持向量机(SVM)分析,证明该平台可实现精神分裂症(SZ)患者与健康对照(HC)的分类(最高BAC 71.13%)及脑年龄预测(MAE 6.95年),为精神疾病生物标志物研究提供了标准化协作平台。

  

当前精神病学诊断面临严峻挑战:全球约10亿人受精神疾病困扰,预计203年将造成6万亿美元经济损失。然而,基于症状的生物学非知情(biology-uninformed)分类系统无法反映病理生理机制,传统统计方法也难以从多模态数据中提取预测模式。尽管神经影像机器学习(ML)技术展现出突破潜力,但样本量小、异质性高导致模型泛化性差。这一困境亟需建立标准化、大规模的多中心数据平台。

欧洲神经精神药理学学院(ECNP)神经影像网络的研究人员开发了ECNP-NNADR数据仓库,通过虚拟数据池与分析(ViPAR)软件整合7个欧洲中心21个队列的4829名参与者数据,涵盖11种精神疾病和健康对照(HC)。研究采用支持向量机(SVM)和嵌套交叉验证框架,基于多图谱灰质体积(GMV)特征开展概念验证:1) 精神分裂症(SZ)分类模型在跨站点验证中最高平衡准确率(BAC)达71.13%;2) 脑年龄预测模型在健康人群中的平均绝对误差(MAE)为6.95年(R2
=0.77),发现SZ患者存在显著脑龄差距(BrainAGE=4.49年)。

关键技术方法包括:1) 使用CAT12流程处理多中心T1加权结构磁共振成像(MRI)数据,提取Schaefer-200、AAL3和Hammers图谱的GMV特征;2) 通过ViPAR平台实现联邦数据分析;3) 采用L2正则化L2损失支持向量分类(LiblineaRL1L2SVC)和L2正则化L1损失支持向量回归(LiblineaRL2L1SVR)算法;4) 嵌套5折交叉验证框架优化超参数。

研究结果显示:
3.1. 数据仓库特征
ECNP-NNADR包含4829名参与者(51.07% HC),涵盖精神分裂症(SZ)、双相障碍(BDI/II)、抑郁症(MDD)等11种诊断。4580人具有MRI数据,3044人兼具临床与影像数据。临床量表覆盖儿童创伤问卷(CTQ)、阳性和阴性症状量表(PANSS)等6种工具,最大重叠样本达543人。

3.2. 概念验证分析
3.2.1. 分类分析
匹配498对SZ-HC样本显示:单站点模型在慕尼黑(MUC)和奥斯陆(OSL)分别获得68.60%和70.65%的BAC,但维罗纳(VER)仅50.82%。跨站点模型在MUC+OSL组合训练时达到最高BAC 71.13%,但应用到VER站点时敏感性(SEN)骤降至21.19%,揭示显著的站点异质性。

3.2.2. 回归分析
基于1170名HC建立的脑年龄模型在独立验证集(1161 HC)保持MAE=6.97年(R2
=0.74)。应用于SZ患者时,其BrainAGE显著高于HC(4.49 vs 0.12年,P<0.001),提示加速脑老化。

讨论部分强调,ECNP-NNADR为克服精神医学研究中的样本局限提供了重要解决方案,但结果也暴露关键挑战:1) 站点间扫描参数差异导致分类性能波动;2) 临床异质性(如康复期患者)可能稀释生物标志物信号;3) 验证集样本量变化影响模型稳定性。未来将通过深度学习算法优化站点效应校正,并扩展至体素水平分析和多模态数据整合。

该研究创建了欧洲首个跨诊断神经影像数据协作平台,其创新性体现在:1) 通过ViPAR实现隐私保护的分布式分析;2) 标准化处理流程确保数据可比性;3) 为精神疾病的生物分型提供了可扩展的研究框架。这项工作标志着精神医学向数据驱动的精准医疗迈出了关键一步,其建立的资源共享机制将为全球精神健康研究树立新范式。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号