脑转移瘤多模态MRI纵向数据集:整合临床与影像组学数据推动精准医疗

《Scientific Data》:A longitudinal MRI dataset of brain metastases with tumor segmentations, clinical & radiomic data

【字体: 时间:2025年11月20日 来源:Scientific Data 6.9

编辑推荐:

  本刊推荐:为解决脑转移瘤(BM)诊断和治疗研究中高质量标注影像数据匮乏的问题,研究人员开展了名为“PROTEAS”的主题研究,构建了一个包含40例患者、744次MRI扫描(基线和随访)、45个放疗计划及CT扫描的纵向数据集,并对65个BM病灶进行了增强肿瘤、水肿和坏死核心的精细分割。该数据集还提供了详细的临床、人口统计学和影像组学特征,其共享旨在支持BM自动检测、病灶分割、疾病评估和治疗规划的AI算法开发,对推动精准医疗和临床决策具有重要意义。

  
在神经肿瘤学领域,脑转移瘤(Brain Metastases, BM)作为多种原发性恶性肿瘤的严重并发症,已成为中枢神经系统中最常见的肿瘤类型。据统计,20%至40%的癌症患者在其疾病进展过程中会出现BM,尤其在肺癌、乳腺癌和黑色素瘤患者中更为常见。随着新型治疗手段的出现,患者生存期延长以及影像学技术的进步,BM的检出率呈现上升趋势,这使得BM的临床管理面临巨大挑战。
目前,BM的治疗方式多样,包括手术、化疗、 immunotherapy(免疫治疗)、靶向治疗和放疗(Radiotherapy, RT)等。其中,放疗在平衡肿瘤控制与副作用方面尤为关键,常用技术有全脑放疗(Whole-Brain Radiotherapy, WBRT)和立体定向放射外科(Stereotactic Radiosurgery, SRS)。WBRT适用于多发BM患者,但可能引起全脑放射性损伤;SRS则主要用于预后良好的局限性BM患者,通过高精度局部照射在保护健康组织的同时优化肿瘤控制。
磁共振成像(Magnetic Resonance Imaging, MRI)凭借其卓越的软组织对比度,已成为BM检测、治疗规划和疗效监测的首选影像学手段。常规脑部MRI协议包括T1加权(T1-weighted, T1W)、T2加权(T2-weighted, T2W)、液体衰减反转恢复(Fluid-Attenuated Inversion Recovery, FLAIR)及对比增强T1加权(T1-Contrast)序列。其中,T1-Contrast序列是BM检测和表征的“金标准”,而T2W和FLAIR序列则能有效显示病灶周围水肿。
尽管MRI技术不断进步,BM的精准管理仍面临一大瓶颈:高质量、标注完善的影像数据集严重不足。现有公共数据集如The Cancer Imaging Archive(TCIA)和BraTS-METS 2023等多局限于治疗前数据,仅标注有限的肿瘤亚区(如增强区域或坏死区),且缺乏治疗细节和纵向随访信息。这极大限制了人工智能(AI)算法在BM自动检测、分割和预后预测中的泛化能力和临床转化。
为应对这一挑战,由Dimitra Flouri领衔的研究团队在《Scientific Data》上发表了题为“A longitudinal MRI dataset of brain metastases with tumor segmentations, clinical & radiomic data”的数据描述论文,推出了一个名为PROTEAS的综合性纵向数据集。该数据集收录了来自塞浦路斯Bank of Cyprus Oncology Centre(BoCOC)2019年至2024年间的40例BM患者数据,包含744次MRI扫描(基线和多次随访)、45个放疗计划(Radiotherapy Plan, RTP)和CT扫描,并对65个BM病灶进行了精细分割,定义了增强肿瘤、水肿和坏死核心三个关键区域。此外,数据集还提供了丰富的临床、人口统计学和影像组学数据,旨在支持BM相关AI模型的开发与验证,尤其满足BraTS-METS 2025 Lighthouse Challenge对治疗后影像数据的需求。
研究方法上,作者团队首先从BoCOC招募了经病理或临床确诊的BM患者,所有参与者均签署知情同意,且影像数据均包含T1W、T2W、T1-Contrast和FLAIR四种标准MRI序列。图像质量经专业放射科医师审核,排除运动伪影显著的扫描。DICOM格式的原始数据经匿名化处理后,转换为NIfTI格式,并利用BraTS-Preprocessor工具将其空间标准化至BraTS框架,确保数据互操作性和可比性。肿瘤分割采用多种方法结合:先使用深度学习模型DeepBraTumIA和nnU-Net进行自动分割,对多发病灶则辅以Imalytics Preclinical软件进行半自动分割,并由资深神经放射科医师手动校正。影像组学特征提取采用Pyradiomics包,在经N4偏置场校正和强度裁剪的图像上,提取了110个特征,包括一阶统计量、形状描述符和纹理特征。所有分割结果和影像数据均对齐至BraTS空间,RTP和CT数据也通过非刚性配准与MRI图像对齐。
Subject characteristic
本研究纳入40例BM患者,共65个转移灶。原发肿瘤以非小细胞肺癌(65%)和乳腺癌(32.5%)为主。所有患者均接受SRS或分次立体定向放疗(Stereotactic Fractionated Radiotherapy),基线及随访MRI在预定的6周、3个月、6个月、9个月和12个月时间点完成,确保纵向数据的系统性。影像参数经DICOM头文件提取并汇总,显示扫描场强包括1.5T和3T,由Philips、Siemens和Toshiba等厂商设备完成。
Ethical approval
研究遵循赫尔辛基宣言,获塞浦路斯国家生物伦理委员会批准(EEBK/EII/2021/72)。所有数据经匿名化处理,保护患者隐私。
Image acquisition
MRI扫描参数中位值如表1所示,T1-Contrast序列在注射钆对比剂(Gadovist)后获取,多数扫描在自由呼吸条件下完成。图像预处理环节,DICOM至NIfTI的转换通过dcm2niix实现,后续空间标准化确保数据与BraTS挑战赛标准兼容。
Segmentation procedure
肿瘤亚区分割结果经ITK-SNAP 4.0.2可视化验证,标签统一为:坏死核心(Label 1)、增强肿瘤(Label 2)、水肿(Label 3),正常脑组织如脑室(Label 10)、白质(Label 30)、灰质(Label 40)和脑脊液(Label 50)亦被标注。
Radiomic-based analysis
影像组学分析共提取每例患者各模态、各区域的110个特征,涵盖一阶统计、形状和纹理特征,灰度离散化箱宽设为5,以保障特征可重复性。
Data Record
数据集存储于Zenodo平台,每位患者数据以独立文件夹组织,内含BraTS空间下的NIfTI格式影像及分割文件,以及临床与影像组学Excel表格。数据结极便于纵向分析疾病进展与治疗反应。
Technical Validation
数据质量由多专家保障:BM诊断经放射肿瘤学家确认,影像质量由MRI分析专业人员审核,分割结果由神经放射学家手动校正,确保临床可靠性。
Usage Notes
建议使用FSLeyes、ITK-SNAP或3D Slicer等软件处理NIfTI数据,Horos和3D Slicer适用于DICOM文件,以保证物理空间和方向的一致性。
综上所述,PROTEAS数据集通过提供多模态MRI、精细肿瘤分割、纵向随访及丰富的临床-影像组学数据,填补了BM研究领域高质量公共数据的空白。其突出优势在于涵盖治疗后影像和多个时间点,支持肿瘤生物学时空动态分析,这是现有资源所缺乏的。该数据共享倡议将加速BM自动检测、分割和预后预测的AI算法开发,推动精准医疗在神经肿瘤学的临床转化。未来,这一资源有望成为BraTS-METS等国际挑战赛的重要基准,促进跨机构合作和算法标准化,最终提升BM患者的诊疗水平。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号