编辑推荐:
为提高肺癌亚型分类准确性,研究人员结合影像组学与深度学习,发现该方法可有效分类肺癌亚型,意义重大。
肺癌,这个 “健康杀手” 在全球范围内肆虐,是导致癌症相关死亡的主要原因之一。肺癌并非单一的疾病,而是包含多种亚型,不同亚型的生物学行为和临床结果差异巨大。准确识别这些亚型,对患者的早期诊断和个性化治疗极为关键。以往,传统的诊断方法在面对肺癌时显得力不从心,尤其是在疾病早期,误诊、漏诊情况时有发生。随着科技的发展,医学影像技术不断进步,其中计算机断层扫描(CT)成为肺癌诊断的重要手段。但 CT 图像的复杂性和多变性,让传统诊断方法难以精准分析。影像组学,作为新兴的技术,能从医学图像中提取定量特征,为肺癌诊断带来新希望。然而,它也面临着数据复杂、特征难以筛选等挑战。深度学习的出现,特别是卷积神经网络(CNN),在图像特征提取方面展现出强大的能力。但 CNN 容易关注到图像中无关的部分,导致过拟合或误判。在这样的背景下,开展一项能够结合多种技术优势、提高肺癌亚型分类准确性的研究迫在眉睫。
来自多个国家不同机构的研究人员共同开展了此项研究。他们提出了一种名为 Deep Radiomics 的新型框架,将影像组学、深度学习和注意力机制相结合,旨在提升肺癌亚型分类的准确性、模型的可解释性和稳健性。该研究成果发表在《Discover Oncology》上。
为开展此项研究,研究人员采用了多种关键技术方法。首先,他们收集了来自五个医疗中心的 2725 例肺癌患者的 CT 图像作为样本队列。这些图像涵盖了多种肺癌亚型,包括小细胞肺癌(SCLC)、腺癌、鳞状细胞癌、大细胞癌和肺类癌肿瘤。之后,研究人员对 CT 图像进行预处理,包括裁剪、调整分辨率、归一化 Hounsfield Unit(HU)值和高斯平滑等操作。影像组学特征的提取借助 PyRadiomics 库完成,这些特征被分为一阶统计量(FOS)、基于形状的特征和基于纹理的特征等类别。深度学习方面,研究人员设计了一种 DeepCNN 架构,并在第二个卷积块中集成了注意力机制,用于深度特征提取和多类分类。此外,研究人员运用了非负矩阵分解(NMF)、递归特征消除(RFE)等特征选择技术,结合 XGBoost、LightGBM、Stacking 等机器学习模型进行分类,并通过五折交叉验证、组内相关系数(ICC)计算等方法对模型进行验证和评估。
研究结果如下:
- 影像组学特征的可重复性分析:通过 ICC 分析评估影像组学特征的可重复性,发现不同类别特征的可靠性存在差异。例如,在 19 个 FOS 特征中,10 个(52.6%)具有良好的可靠性;形状 - based 类别中,60% 的特征显示出良好的可重复性;纹理特征的变异性较大,其中 GLRLM 和 GLSZM 在纹理特征中显示出相对较高的可靠性。而在 DeepCNN 提取的深特征中,98% 的特征 ICC 值低于 0.75,表明深特征的可重复性较差,需要进行严格的特征选择123。
- 基于影像组学特征的模型性能:对比不同机器学习模型与特征选择方法的组合,发现 XGBoost 与 NMF 的组合在所有指标上表现最佳,测试准确率达到 85.07%,AUC 为 85.98%,敏感性为 87.77%。Stacking 与 RFE 的组合也表现出色,但投票与 t-SNE 的组合性能最低。这表明 NMF 和 RFE 等特征选择方法,尤其是与 XGBoost 和 Stacking 等模型结合时,能优化分类性能4。
- DeepCNN 有无注意力机制的性能对比:实验结果显示,使用注意力增强特征的模型性能更优。如 XGBoost 与 RFE 结合,在使用注意力增强特征时,测试 AUC 达到 88.39%,敏感性为 91.44%;而没有注意力机制时,XGBoost 与 NMF 组合的测试 AUC 为 86.62%,敏感性为 85.68%。这充分说明了注意力机制能够提升特征质量,进而提高分类性能5。
- DeepCNN 特征与影像组学结合的性能:综合 DeepCNN 特征和影像组学描述符,有注意力机制时,XGBoost 与 NMF 组合的整体性能最高,测试准确率为 92.47%,AUC 为 93.99%,敏感性为 92.11%;没有注意力机制时,XGBoost 与 NMF 组合的测试准确率为 89.86%,测试 AUC 为 91.38%,敏感性为 89.50%。这表明注意力机制能显著提高预测准确性,且整合影像组学和 DeepCNN 特征对肺癌亚型分类具有重要潜力67。
研究结论与讨论部分指出,该研究整合影像组学和深度学习特征,利用注意力增强的 DeepCNN 模型,在肺癌亚型分类上取得了显著成果,分类准确性达到 92.47%,AUC 为 93.99%,超越了传统方法。与其他相关研究相比,该研究不仅在准确性上表现更优,还通过 ICC 分析确保了特征的跨扫描仪一致性,增强了模型的可解释性和稳健性。然而,研究也存在一定局限性,如数据集患者数量相对较少,限制了跨中心评估;仅使用了 CT 扫描,未整合其他模态;注意力机制虽然提升了性能,但增加了模型复杂性,其可解释性仍面临挑战。未来研究可进一步扩大数据集,探索多模态成像方法,优化模型以减少过拟合,并增强注意力机制的透明度。总体而言,该研究为肺癌的精准诊断和个性化治疗提供了有力支持,有望推动肺癌诊断技术的发展,为临床决策提供更可靠的依据。