扩散张量MRI数据ComBat标准化方法的可迁移性评估及其在多中心神经影像研究中的应用价值
《Annals of Biomedical Engineering》:Evaluating Transferability of ComBat Harmonization of Diffusion Tensor Magnetic Resonance Imaging Data
【字体:
大
中
小
】
时间:2025年11月09日
来源:Annals of Biomedical Engineering 5.4
编辑推荐:
本研究针对多中心DTI研究中传统ComBat方法需反复重新计算的问题,创新性地提出可迁移ComBat(T-ComBat)算法。通过分析314名青少年的FA和MD数据,研究发现T-ComBat可在保持原有数据不变的前提下有效标准化新受试者数据,当新增样本量控制在训练组25%(FA)和10%(MD)以内时可实现理想标准化效果,为纵向多中心研究提供了重要方法论支持。
在神经影像研究领域,扩散张量成像(DTI)技术通过测量水分子在脑组织内的扩散特性,为探索白质微结构提供了重要窗口。特别是在研究神经退行性疾病、脑卒中、创伤性脑损伤等病理状态时,DTI衍生的各项异性分数(FA)和平均扩散率(MD)指标已成为不可或缺的生物标志物。然而,这种先进的成像技术面临着严峻挑战——单中心研究受限于扫描时间和成本,难以获得大样本数据,而多中心合作又因不同扫描仪的品牌、序列参数等差异引入系统误差,严重影响了研究结果的可靠性和可重复性。
传统的数据标准化方法ComBat虽然能有效消除多中心数据中的批次效应,但其固有缺陷在于每次新增受试者都需要重新计算标准化参数,这意味着长期纵向研究中已发表的结果可能因后续数据加入而改变。这种“推倒重来”的模式显然不适用于那些持续数年、分阶段收集数据的大规模多中心合作项目。正是基于这一现实需求,研究者开始探索ComBat标准化方法的可迁移性问题:能否像训练好的机器学习模型直接应用于新数据那样,将基于既定训练集计算的标准化参数直接迁移到新受试者,而无需改变已标准化数据?
在这项发表于《Annals of Biomedical Engineering》的研究中,Bradley Fitzgerald和Thomas M. Talavage系统评估了可迁移ComBat(T-ComBat)算法在DTI数据标准化中的实际效果。研究团队创新性地提出,将ComBat标准化参数的计算与应用程序分离——首先在固定训练集上获得标准化参数,然后将这些参数直接应用于新受试者数据。他们重点探讨了训练集规模对标准化效果的影响,为多中心DTI研究的实践操作提供了具体指导。
研究采用美国国家青少年酒精与神经发育-成年 consortium (NCANDA-A)提供的多中心数据,精心筛选了314名12-21岁青少年的DTI数据,分别来自加州大学圣地亚哥分校(GE扫描仪)和俄勒冈健康与科学大学(Siemens扫描仪)两个中心。所有数据均经过严格质量控制,包括头部运动校正和图像配准等预处理步骤,确保后续分析的可靠性。
关键技术方法包括:使用FSL和ANTs软件进行图像预处理和配准;采用JHU白质图谱进行区域分析;通过ComBat算法估计站点效应的加性和乘性参数;设计重复抽样验证方案评估T-ComBat性能;采用重叠指数(η)和全ComBat性能内比例(PwFC)量化标准化效果。
通过多元线性回归分析发现,站点和年龄对FA和MD均有显著影响,性别仅与FA显著相关,而种族因素对两者均无显著影响。这一发现为后续ComBat标准化提供了关键协变量选择依据,确保标准化过程能够准确校正非生物学因素造成的偏差。
随着训练集样本量(nTrain)的增加,T-ComBat的标准化效果稳步提升,但始终未能达到全ComBat(使用全部314名受试者)的性能水平。具体而言,当评估20名新受试者(每站点)的标准化效果时,FA数据的标准化效果在nTrain达到80-110时趋于稳定,而MD数据的标准化效果相对更好。在ROI水平分析中,T-ComBat表现出与全ComBat更接近的性能,提示区域平均策略可能部分抵消体素水平的残留差异。
研究发现,T-ComBat能够成功标准化的新增样本量存在明确上限:对于FA数据,新增样本量不宜超过原训练集的25%;对于MD数据,这一比例仅为10%。超过这些阈值,合并数据集的标准化效果将显著下降,提示需要重新进行全ComBat标准化。
分析显示,靠近脑脊液区域的白质体素,特别是侧脑室后部周围区域和小脑白质边缘,最容易在T-ComBat标准化后仍保留站点间差异。这些区域通常受部分容积效应(PVE)影响较严重,不同受试者间组织类型配准不一致可能是导致标准化效果不佳的主要原因。
有趣的是,全ComBat标准化后的站点间差异甚至低于同一站点内随机分组间的差异,提示ComBat算法可能存在“过度标准化”现象,即不仅消除了站点差异,还可能抹去了一些真实的生物学变异。这一发现值得在后续研究中进一步探讨。
本研究通过系统评估确立了T-ComBat在多中心DTI研究中的实用价值,同时明确了其适用范围和局限性。研究结果为大样本神经影像研究,特别是那些需要分阶段分析的长周期项目,提供了重要的方法论参考。虽然T-ComBat无法完全取代全ComBat,但在严格控制新增样本比例的前提下,它为研究者提供了一种平衡效率与准确性的可行方案。
未来研究可进一步探索T-ComBat在其他影像模态(如功能MRI、皮质厚度等)中的适用性,并优化算法以减轻对PVE敏感区域的标准化不足问题。同时,不同组织类型配准精度对标准化效果的影响也值得深入分析,这将有助于提升多中心神经影像数据的可比性和可靠性,推动神经科学领域的大样本研究发展。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号