编辑推荐:
为解决胎儿磁共振成像(MRI)数据稀缺且异质性大的问题,研究人员开展了合成胎儿脑 MRI 图像数据集的研究。他们生成 594 个低分辨率 T2加权图像系列,经验证,新数据集更逼真,可助力开发先进后处理方法及人工智能模型。
在生命的奇妙旅程中,胎儿大脑的发育一直是科学界关注的焦点。早期大脑成熟对人一生的健康有着至关重要的影响,各种遗传和环境因素都可能改变其复杂的结构和功能发育过程。因此,准确描绘胎儿在子宫内的大脑发育情况就显得尤为关键。磁共振成像(Magnetic Resonance Imaging,MRI)作为一种新兴的辅助诊断手段,在胎儿大脑发育研究中具有独特优势,它能提供软组织的良好对比,且创伤极小。然而,在实际应用中,MRI 却面临着诸多挑战。一方面,由于它并非胎儿孕期随访的一线诊断工具,大规模临床数据集相对稀缺;另一方面,不同扫描设备和医院缺乏标准化的成像协议,导致 MRI 图像的对比度和质量差异很大。此外,现有的数据大多经过大量后处理,与真实临床场景存在差距,而且至今没有数据库提供带注释的胎儿脑低分辨率系列图像。在这样的背景下,为了突破数据困境,来自瑞士洛桑大学医院、洛桑大学、巴塞罗那理工大学等机构的研究人员开展了一项极具意义的研究。他们构建了一个全新的合成胎儿脑 MRI 图像数据集,相关研究成果发表在《Scientific Data》上。
研究人员开展这项研究主要运用了以下几个关键技术方法:一是利用公开的胎儿组织注释(Fetal Tissue Annotations,FeTA)数据集提取输入解剖模型,该数据集包含 90 名受试者,经质量控制后用于研究;二是基于高斯隐马尔可夫随机场(Gaussian Hidden Markov Random Field,GHMRF)模型和期望最大化算法,对胎儿脑白质(White Matter,WM)异质性进行建模,模拟脑组织结构在不同孕周(Gestational Age,GA)的变化;三是使用新的胎儿脑磁共振采集数值模型(Fetal Brain MR Acquisition Numerical phantom,FaBiAN v2.0)生成模拟数据,并通过与原始版本对比以及在自动胎儿脑多组织分割中的应用进行验证。
下面来详细看看研究结果:
- 定性评估模拟低分辨率系列图像的真实性:研究人员邀请了一位儿科神经放射学家和一位神经放射学家,对 29 名受试者(16 名神经典型和 13 名病理受试者)使用 FaBiAN v1.2 和 FaBiAN v2.0 生成的合成 T2加权低分辨率(Low Resolution,LR)系列图像进行独立盲法评估。结果发现,FaBiAN v2.0 生成的图像在整个孕期都比 FaBiAN v1.2 更逼真。在实验 1 中,儿科神经放射学家认为 FaBiAN v2.0 生成的图像在超过 96.5% 的情况下更逼真,神经放射学家则认为所有受试者中 FaBiAN v2.0 生成的图像都更逼真。在实验 2 中,独立评估结果也显示 FaBiAN v2.0 生成的 LR 系列图像整体上更逼真。这表明 FaBiAN v2.0 能够更好地捕捉白质组织内的局部变化,从而生成更接近真实临床图像的模拟数据。
- 模拟图像与原始临床图像的定量比较:研究人员通过计算合成数据(FaBiAN v1.2 和 FaBiAN v2.0)和真实临床数据的超分辨率(Super-Resolution,SR)重建之间的互信息(Mutual Information,MI)来量化它们的相似性。结果显示,随着胎儿年龄的增长,FaBiAN v2.0 生成的数据与临床数据的 SR 重建之间的 MI 增加,而 FaBiAN v1.2 生成的数据与临床数据的 SR 重建之间的 MI 减少。这说明 FaBiAN v2.0 考虑了脑成熟过程中的局部 WM 变化,增强了模拟图像的真实性,使其与真实临床数据更相似。
- 利用模拟数据进行胎儿脑多组织自动分割的可行性研究:研究人员以 FeTA 数据集中的 88 名 SR 重建临床受试者为基础,结合相应的高分辨率(High Resolution,HR)标签图,将数据集分为训练集(70 名受试者)和测试集(18 名受试者)。利用 FaBiAN v2.0 生成逼真的 T2加权 MR 图像,并使用 nnU-Net 进行自动分割实验。结果发现,仅用合成图像训练的模型就能达到可接受的组织分割性能(Dice 相似系数DSC0~=0.800.21),且随着训练集中真实图像数量的增加,模型性能显著提升(如DSC6~=0.850.14 ,DSC12~=0.890.12 ),接近仅用真实图像训练的模型性能(DSC70~=0.920.11 )。这表明模拟数据可有效减少对真实数据的依赖,在胎儿脑多组织分割任务中具有重要应用价值。
综合以上研究结果,这项研究构建的合成胎儿脑 MRI 图像数据集具有重要意义。它不仅为研究人员提供了大量高度逼真的模拟数据,有效补充了稀缺的临床数据集,还为开发先进的后处理方法和前沿的人工智能模型奠定了坚实基础。在未来的胎儿脑研究中,该数据集有望发挥更大的作用,帮助我们更深入地了解胎儿大脑发育过程,为早期诊断和干预相关疾病提供有力支持。同时,研究中使用的方法和模型也为后续类似研究提供了宝贵的参考,推动了整个领域的发展。