多期 3D 增强 CT 成像数据集:为原发性肝癌诊疗 “精准导航”

【字体: 时间:2025年05月11日 来源:Scientific Data 5.8

编辑推荐:

  原发性肝癌发病率和死亡率高,准确诊断和分类对治疗意义重大。对比增强计算机断层扫描(CECT)在肝癌诊断中作用关键,但现有公开数据集存在局限。研究人员构建 3D CECT 数据集,含多种肝癌类型及完整扫描阶段数据,有助于开发和验证肝癌诊断、分割模型。

  在全球范围内,原发性肝癌如同一个可怕的 “健康杀手”,严重威胁着人们的生命健康。它是全球第六大常见癌症,每年新增病例约 905,677 例,死亡人数约 830,180 例,是癌症相关死亡的第三大原因 。对于原发性肝癌来说,早期发现并准确诊断,就像是抓住了 “救命稻草”,能大大提高患者的治疗成功率和生存率。而且,精确诊断对于选择最佳治疗策略也至关重要,有助于减少复发,提升患者的生活质量。
原发性肝癌包含肝细胞癌(Hepatocellular Carcinoma,HCC)、肝内胆管细胞癌(Intrahepatic Cholangiocarcinoma,ICC)和混合型肝细胞 - 胆管细胞癌(Combined Hepatocellular-Cholangiocarcinoma,cHCC-CCA)等多种亚型,不同亚型的治疗方法差异很大。这就好比不同的锁需要不同的钥匙来开,准确诊断出肝癌的亚型,才能为患者 “量身定制” 合适的治疗方案。

对比增强计算机断层扫描(CECT)是检测和诊断肝癌的重要工具,它具有高灵敏度和特异性,尤其是在识别像 HCC 这样的富血管肿瘤时表现出色,能在动脉期清晰显示肿瘤的强化情况,还能帮助评估肿瘤血管情况,为判断肿瘤的侵袭性和制定治疗计划提供重要依据。随着深度学习技术的发展,其在医学影像分析领域取得了显著进展,利用肝癌多期 CECT 图像有助于更好地识别原发性肝癌的亚型,凸显了完整阶段 CECT 数据在构建高质量诊断模型中的重要性。

然而,目前公开可用的原发性肝癌 CECT 数据集存在诸多问题。比如,一些数据集只聚焦于单一类型的癌症,无法涵盖肝癌的多种亚型;还有些数据集缺乏完整的成像阶段覆盖,无法全面反映肝癌在不同阶段的特征;部分数据库样本数量太少,根本无法满足训练分类或分割模型的需求。这些数据上的局限,就像一道道 “关卡”,阻碍了肝癌研究在准确分类和精确分割病变方面的进展。

为了突破这些困境,重庆渝北区人民医院等研究机构的研究人员开展了一项极具意义的研究。他们构建了一个全新的 3D CECT 数据集,该数据集涵盖了各种类型的原发性肝癌,并且包含了完整的扫描阶段数据。同时,为了帮助研究人员更好地区分肿瘤组织和正常组织,还纳入了非肝癌患者的 CECT 扫描作为对照组。研究结果显示,这个数据集包含 278 例肝癌患者(其中 HCC 患者 94 例、ICC 患者 99 例、cHCC-CCA 患者 85 例)和 83 例非肝癌个体的完整 3D CECT 成像数据,共收集到 50,560 个标注的病变切片。这一成果意义非凡,为开发和验证原发性肝癌分类和分割模型提供了宝贵的数据支持,在肝癌的早期检测、分类和监测等临床应用方面也具有巨大的潜力。该研究成果发表在《Scientific Data》上。

研究人员在构建这个数据集时,运用了多种关键技术方法。首先,他们从重庆渝北区人民医院放射科 2015 年 1 月至 2022 年 12 月的患者中进行回顾性样本收集,严格按照既定的纳入和排除标准筛选患者。然后,利用医院 PACS 系统中的回顾性数据,获取患者术前两周内的全多期增强 CT 扫描图像。通过 SimpleITK 软件将单切片 DICOM 图像合并为 3D CECT 图像,并转换为 NIFTI 格式。接着,使用 LiverMask 工具的预训练模型和 ITK-SNAP 软件对肝脏和病变区域进行标注,标注过程中由两位独立的临床医生分别进行,若存在差异则共同审核修改直至达成一致。最后,对数据进行去识别化处理,并通过一系列自动化和手动验证程序确保数据的完整性、一致性以及隐私合规性。

研究结果主要从以下几个方面呈现:

  • 数据记录:该数据集在 Science Databank 平台上以公共访问模式共享,遵循 Creative Commons Attribution 4.0 International(CC BY 4.0)许可协议。数据包含原发性肝癌患者和对照组的 3D CECT 图像,存储为 NIFTI 格式,涵盖平扫、动脉期、静脉期和延迟期四个成像阶段,同时提供肝脏和病变区域的掩模文件以及包含患者信息的 CSV 元数据文件。
  • 数据概述:肝癌患者组的中位年龄为 59 岁,男性占 67.3%,共 1,112 张 3D CECT 图像,每个患者平均有 124.00(82.00 - 188.00)个切片,其中含病变的切片中位数为 37.00(22.00 - 59.25)个,病变体积中位数为 75.37cm3 (26.70 - 239.24),最大病变直径中位数为 9.60 cm(6.66 - 13.46),每个患者的病变数中位数为 1.00(1.00 - 1.00)。非肝癌组中位年龄为 41 岁,女性占 81.9%,有 332 张 3D CECT 图像,无病变数据。

在研究结论和讨论部分,虽然该数据集是单中心数据集,在模型开发和验证时可能需要额外数据,但研究人员相信其公开发布具有重要价值。它既可以与其他来源的更大数据集整合使用,也能作为外部验证集供其他研究人员使用。这个数据集的出现,为原发性肝癌的研究和临床实践提供了有力的数据支撑,就像为肝癌诊疗点亮了一盏 “明灯”,有助于推动肝癌早期检测、精准诊断和个性化治疗的发展,为提高肝癌患者的生存率和生活质量带来了新的希望 。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号