揭秘颅内生殖细胞瘤:构建综合数据集,开启 AI 精准诊断新征程

【字体: 时间:2025年02月22日 来源:Scientific Data 5.8

编辑推荐:

  为解决颅内生殖细胞瘤(GCTs)诊断准确性及 AI 模型训练数据不足问题,广西医科大学研究人员开展相关研究,构建含多种数据的公开数据集。该研究成果为 AI 诊断提供支撑,强烈推荐科研读者阅读。

  
在医学的神秘世界里,有一种疾病悄然影响着青少年的健康,它就是颅内生殖细胞肿瘤(Intracranial germ cell tumors,GCTs)。这是一类罕见且复杂的原发性脑肿瘤,虽然只占小儿脑肿瘤的 2% - 10%,但却不容小觑。它们最喜欢在青少年时期(10 - 19 岁)“搞破坏”,一旦出现,就会带来一系列麻烦,比如颅内高压,让患者头疼欲裂;视觉障碍,影响孩子看世界;还有激素紊乱,干扰身体正常发育。

在颅内生殖细胞肿瘤这个 “大家族” 里,生殖细胞瘤(Germinoma)是最常见的成员,占到了 60% - 70%。它虽然是恶性肿瘤,却有个 “奇怪” 的特性 —— 对放化疗极为敏感。要是单独进行放疗,患者 5 年生存率能超过 90%,这意味着大部分患者不用非得进行神经外科手术切除肿瘤就能实现临床治愈。

不过,这里面有个大问题。准确诊断生殖细胞瘤对患者的治疗和预后至关重要,但目前的诊断方法却有些 “力不从心”。常规的医学影像特征和生物标志物联合诊断,虽然能搞定大部分生殖细胞瘤的诊断,但在鉴别诊断时却容易 “翻车”,出现误诊的情况。

再看看人工智能(Artificial Intelligence,AI),它在医学领域可是个 “冉冉升起的新星”,特别是在疾病诊断方面表现出色。它能提高诊断准确率,还能减少不必要的实验室检查和有创的病理检查。不少研究尝试用机器学习(Machine Learning,ML)算法来区分生殖细胞瘤和其他恶性肿瘤,也取得了一定成果。但这些研究都有个通病,就是使用的数据集太小,而且大多来自单个医院,缺乏多样性,因为不同医院的患者群体和成像协议都不一样。更尴尬的是,目前根本没有公开可用的生殖细胞瘤成像数据集,这就好比做饭没有食材,AI 算法很难 “大展身手”。

为了解决这些难题,广西医科大学第一附属医院和广西医科大学附属肿瘤医院的研究人员决定 “迎难而上”。他们在《Scientific Data》期刊上发表了一篇名为 “A comprehensive dataset of Germinoma on MRI/CT with clinical and radiomic data” 的论文,试图为生殖细胞瘤的诊断开辟新道路。他们的目标是创建一个综合数据集,包含磁共振成像(Magnetic Resonance Imaging,MRI)、计算机断层扫描(Computed Tomography,CT)的结果,还有临床和影像组学数据,用这些数据来训练和验证 AI 模型,提高生殖细胞瘤诊断的准确性,避免不必要的手术。

研究人员在这场 “科研战役” 中,用了不少关键技术方法。首先是数据收集,他们从两家医院回顾性收集了 65 例经活检确诊为生殖细胞瘤患者的资料,严格按照标准筛选,保证数据质量。接着是图像采集,用 1.5 - T 或 3.0 - T 的 MRI 扫描仪获取 50 例患者的多种 MRI 序列图像,用 64 - 56 层、192 - 5 层或 256 - 2 层的 CT 扫描仪获取 63 例患者的 CT 图像。然后是图像分割,利用开源的 ITK - SNAP 软件对图像进行半自动分割,两位经验丰富的放射科医生还会仔细检查和修正。最后,用 FeAture Explorer Pro 软件在 Python 环境中提取影像组学特征,这些特征包含多种类型,能为后续研究提供丰富信息。

下面来看看研究的成果。

  1. 构建数据集:研究人员成功建立了一个公开的生殖细胞瘤数据库,这个数据库内容超丰富。它包含 63 例 CT 和 50 例 MRI 数据集,涵盖了多种成像序列,像轴向 T?加权成像(T?WI)、T?加权液体衰减反转恢复(FLAIR)、T?加权成像(T?WI)、T?加权增强成像(T?WI_CE)、扩散加权磁共振成像(DWI)和 CT 图像。通过对 65 例患者的结果进行半自动分割,从每个成像序列中生成了 1688 种不同特征。这些数据都存放在 figshare 存储库中,方便其他科研人员使用。
  2. 数据记录与存储:所有收集到的数据都存储得井井有条。原始医学图像以 DICOM 格式保存,肿瘤分割图像和匹配的原始医学图像则以 NIfTI 格式存储。研究人员还贴心地上传了一个 zip 文件,里面有三个文件,一个是 DICOM 格式的患者数据,一个是 NIfTI 格式的患者数据、分割图像和原始图像,还有一个包含七个 excel 文件,里面是所有临床数据和影像组学特征。而且,为了保护患者隐私,所有图像信息都进行了匿名化处理。
  3. 技术验证:为了确保数据质量,研究人员进行了严格的技术验证。在数据收集方面,只有通过开颅手术或脑室镜检查确诊为生殖细胞瘤的患者才被纳入研究,并且由经验丰富的神经外科医生进行数据筛选和核对。图像分割方法也经过了专家验证,一位专家分割后,另一位专家会进行交叉核对。为了评估特征值提取的可重复性,研究人员还随机选了 20 例患者,让同一位放射科医生和另一位放射科医生在 1 个月后重新进行肿瘤分割,然后分别进行观察者内和观察者间一致性分析,确保数据稳定可靠。

最后来总结一下研究结论和讨论部分。这项研究意义非凡,它建立了首个公开的生殖细胞瘤综合数据集,把临床数据和多种影像特征结合起来,为后续的 AI 大数据研究打下了坚实基础。有了这个数据集,科研人员就能更好地训练 AI 算法,开发出更准确的诊断模型,帮助医生更精准地诊断生殖细胞瘤,减少误诊,避免患者遭受不必要的手术痛苦。这不仅能提高患者的治疗效果,改善他们的生活质量,还为生殖细胞瘤的研究开辟了新方向,让我们离攻克这种疾病又近了一步。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号