
-
生物通官微
陪你抓住生命科技
跳动的脉搏
开放多厂商DICOM验证数据集:推动神经影像研究的跨平台可重复性
【字体: 大 中 小 】 时间:2025年07月10日 来源:Scientific Data 5.8
编辑推荐:
为解决神经影像研究中因厂商私有DICOM标签和软件版本差异导致的参数提取难题,研究人员创建了涵盖CT/MR多模态的36个标准化DICOM验证数据集。通过提供原始DICOM文件与BIDS格式的NIfTI图像及元数据JSON文件,该项目揭示了厂商在公共/私有标签及专用数据结构中的编码规律,为dcm2niix等工具提供基准测试,显著提升跨厂商数据转换的准确性,推动神经影像分析的可重复性。
在神经影像研究中,可重复性长期受制于一个隐形壁垒:不同厂商的扫描仪像说着不同的方言。虽然DICOM标准旨在实现医疗影像数据的互操作性,但制造商常将关键采集参数(如层序时间、相位编码方向)藏匿于私有标签(private tags)中,或通过专属数据结构(如"Other Byte"类型)加密。更棘手的是,随着增强型DICOM(enhanced DICOM)等新标准的演进,不同软件版本对同一参数的解读可能南辕北辙——例如西门子XA61系统曾错误标注多波段加速因子(MultibandAccelerationFactor)。这些"方言差异"导致跨中心研究的数据整合如履薄冰,甚至影响阿尔茨海默病等重大疾病的影像标志物验证。
为此,南卡罗来纳大学心理学系麦考斯兰脑成像中心(McCausland Center for Brain Imaging)联合全球20余家机构,在《Scientific Data》发表了一套革命性解决方案:36个开放DICOM验证数据集。通过精心设计的低分辨率模体(phantom)和少量人脑影像样本,这些数据集覆盖了佳能、GE、飞利浦、西门子等主流厂商的CT/MR设备,囊括动脉自旋标记(ASL)、扩散加权成像(DWI)、场图(fmap)等12类模态,重点标注了厂商在以下三类"方言"中的典型表达:(1)用私有标签存储BIDS关键字段(如表位参数TablePosition被分散编码于GE的0043,10B2、西门子的0021,1005等标签);(2)通过OB(Other Byte)类型隐藏专属数据结构;(3)经典DICOM与增强DICOM对同一参数(如重复时间RepetitionTime)的歧义定义。更创新的是,每个数据集均提供"参考答案":原始DICOM文件(In文件夹)与经人工校验的BIDS格式输出(Ref文件夹),包括NIfTI图像、JSON元数据及梯度方向文件(.bvec/.bval),形成可直接验证工具性能的黄金标准。
研究团队采用模块化策略构建验证体系:
1. 厂商"方言"破译手册(关键边缘案例库)
通过36个数据集(表1)系统揭示厂商特异性编码规律:
2. DICOM到BIDS的"语义桥梁"
建立两类标签映射表:
3. 工具验证效能提升
数据集已整合至7类主流工具测试流程:
这项研究构建了神经影像领域的"罗塞塔石碑":通过标准化DICOM验证数据集,首次系统化解码了不同厂商的参数存储"方言",为影像分析工具提供了跨平台校验基准。其核心突破在于:
正如论文通讯作者Christopher Rorden强调:"当制造商看到社区用我们的数据集揭示其参数存储错误时,修复速度显著提升。" 这套开放验证资源将持续演化,最终实现神经影像研究的"世界语"梦想——无论数据来自何种设备,科学发现皆可复现。
注:专业术语处理示例
生物通微信公众号
知名企业招聘