
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于Vision Transformer与机器学习的CT影像肺结节分类新方法:提升诊断准确性与泛化能力
【字体: 大 中 小 】 时间:2025年06月17日 来源:Journal of Radiation Research and Applied Sciences 1.7
编辑推荐:
本研究针对CT影像中肺结节良恶性鉴别难题,创新性地整合Vision Transformer(ViT)与机器学习技术,开发了端到端ViT模型、深度特征提取和放射组学三种分类策略。通过435例患者数据验证,ViT模型在内外测试集分别达到92%和91%准确率,TabTransformer结合深度特征AUC达96%。研究证实Transformer架构在医学影像分析中的优越性,为肺癌早期诊断提供了高精度AI解决方案。
肺结节的良恶性鉴别是肺癌早期诊断的关键挑战,传统方法依赖放射科医师经验且存在主观差异。随着人工智能技术的发展,深度学习尤其是Vision Transformer(ViT)在医学影像分析领域展现出巨大潜力,但其在肺结节分类中的最优应用策略尚未明确。同时,传统放射组学方法虽具可解释性,但特征提取能力有限。如何整合新兴技术与传统方法,构建高精度、可泛化的分类模型成为当前研究热点。
中国研究人员在《Journal of Radiation Research and Applied Sciences》发表的研究,系统比较了三种肺结节分类策略:端到端ViT模型、基于ViT深度特征的传统/先进机器学习模型(SVM/Random Forest/XGBoost/CatBoost/TabNet/TabTransformer)、以及215个手工放射组学特征方法。研究采用435例患者CT数据(241良性/194恶性)进行训练,并在独立外部测试集(99例)验证,通过5折交叉验证和SHAP分析确保结果可靠性。
关键技术方法包括:1) 多中心CT影像标准化预处理(Hounsfield单位归一化、放射科医师手动校正分割);2) 混合ViT架构(CNN层+Transformer编码器+补丁嵌入);3) 三类特征处理策略(PCA/RFE/MI);4) 超参数网格搜索优化;5) 统计验证(Wilcoxon检验/McNemar检验/DeLong检验)。
研究结果方面:
3.1 患者特征分析显示训练集与测试集在年龄、吸烟史、结节类型等关键指标上均衡分布,保障了模型验证的可靠性。
3.2 SHAP特征重要性分析揭示:
3.3 模型性能比较显示:
3.6 综合分析表明:
讨论部分指出,该研究首次系统验证了ViT在肺结节分类中的三重应用范式。端到端ViT通过自注意力机制实现全局-局部特征协同学习,其性能与最新文献报道的融合模型相当,但仅需单模态CT数据。深度特征提取策略中,TabTransformer展现出对高维特征关系的卓越建模能力,为医学影像的"黑箱"问题提供了解释路径。研究同时证实,经过优化的放射组学特征仍可达到临床可用精度,这对资源有限的医疗机构具有实用价值。
该研究的创新性体现在:1) 开发首个整合CNN与Transformer的肺结节专用ViT架构;2) 首次系统比较ViT深度特征与放射组学特征的价值;3) 验证TabNet/TabTransformer在医学影像分析中的迁移适用性。局限性在于样本来源相对单一,未来需扩大多中心验证。研究为AI辅助肺癌诊断提供了方法论框架,其技术路线可扩展至其他医学影像分类任务。
生物通微信公众号
知名企业招聘