人工智能赋能癌症影像分析:NCI影像数据共享平台中多器官肿瘤AI辅助标注系统的开发与验证

【字体: 时间:2025年07月30日 来源:Scientific Data 5.8

编辑推荐:

  本研究通过人工智能技术为NCI影像数据共享平台(IDC)中的乳腺癌、脑瘤、肝癌等11个癌症影像数据集生成高质量AI标注,采用nnU-Net模型结合放射科医师验证,显著提升3,500余项研究的标注效率。研究团队开发了符合DICOM标准的开源模型,实现DSC达0.98的精准分割,为癌症影像分析提供标准化数据资源。

  

在医学影像分析领域,精准的肿瘤分割标注是癌症诊断和治疗规划的基础,但传统人工标注存在效率低下、成本高昂等问题。当前医学影像数据面临三大瓶颈:仅有少量公开数据集提供体素级标注、缺乏统一的DICOM(Digital Imaging and Communications in Medicine)标准元数据架构、以及跨机构验证的决策支持工具不足。这些问题严重制约了深度学习算法在临床实践中的应用转化。

为解决这些挑战,BAMF Health(美国密歇根州大急流城)联合哈佛医学院、弗雷德里克国家癌症研究实验室等机构的研究团队,在《Scientific Data》发表了突破性研究成果。该研究利用nnU-Net框架开发了六类癌症的AI分割系统,涵盖脑MR、乳腺MR、肾脏CT等11个IDC(Imaging Data Commons)数据集。通过BRATS 20217,8等公开数据集训练模型,并对10%的AI标注进行放射科医师校正,最终生成3,500余项符合FAIR原则的DICOM-SEG标注数据。

关键技术包括:1)基于TotalSegmentator15的解剖学引导模型优化;2)多模态影像的NIfTI格式转换与MNI9空间标准化;3)采用Docker容器实现跨平台部署。研究特别选用National Lung Screening Trial等大型队列,通过BigQuery筛选1,042例肺癌确诊患者的CT数据构建训练集。

【数据记录】
团队在Zenodo平台公开了所有DICOM-SEG格式的标注数据,包含AI预测与放射科医师修正版本。每个文件通过SeriesInstanceUID(0020,000E)关联原始影像,SegmentAlgorithmType(0062,0008)字段区分自动/半自动标注来源。

【技术验证】
定量分析显示:脑MR全肿瘤分割DSC达0.98±0.07,肝脏肿瘤NSD(Normalized Surface Distance)为4.38±8.70(容忍度2mm)。质量评估采用5级Likert量表,放射科医师对82%的肾脏标注给出"强烈同意"评级。值得注意的是,乳腺纤维腺体组织分割存在较大变异(DSC 0.80±0.29),反映该区域的解剖复杂性。

【结论与意义】
该研究创建了目前最全面的开源癌症影像标注体系,其创新性体现在:1)首次在IDC平台实现DICOM-native的AI标注集成;2)通过多专家验证证实临床适用性(45例脑瘤标注经14-30年资历专家复核);3)模型权重与推理代码已在MHub.ai平台开源。局限性在于仅10%数据经过人工校验,且未评估不同扫描协议间的泛化能力。未来工作将增加多中心验证,推动这些工具向临床决策支持系统转化。

研究团队特别强调,所有资源均采用知识共享许可(CC BY 4.0),包括GitHub公开的Jupyter Notebook训练代码。这项工作为打破医学影像分析的数据壁垒提供了重要范例,加速AI在癌症精准医疗中的应用进程。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号