基于混合优化深度学习的肺癌CT图像分类方法研究

《Scientific Reports》:Enriched lung cancer classification approach using an optimized hybrid deep learning approach

【字体: 时间:2025年10月29日 来源:Scientific Reports 3.9

编辑推荐:

  本研究针对肺癌早期诊断中传统CT图像分类准确率不足的问题,提出了一种结合马群优化算法(HHO)和狮子优化算法(LOA)的深度卷积神经网络与长短期记忆网络(DCNN-LSTM)混合模型。通过自适应滤波预处理、病灶分割和优化超参数调谐,在SPIE-AAPM-NCI肺部CT数据集上实现了98.75%的分类准确率,为临床提供了一种非侵入式智能诊断辅助工具。

  
肺癌作为全球死亡率最高的恶性肿瘤之一,其早期诊断直接关系到患者的生存率。传统诊断主要依赖CT扫描和胸部X光等影像学检查,但这些方法需要经验丰富的放射科医生进行人工判读,且良恶性结节在形态特征上存在高度相似性,导致诊断结果存在主观偏差。更棘手的是,当影像学表现不明确时,患者往往需要接受侵入性活检,这不仅增加医疗成本和时间延误,还可能带来手术风险。正是为了解决这些临床痛点,印度SNS工程学院与PSG技术与应用研究所的科研团队开展了一项突破性研究,开发出基于混合优化深度学习的肺癌自动分类系统。
这项创新研究近日发表在《Scientific Reports》期刊上,研究人员巧妙地将生物启发式优化算法与深度学习架构相结合,构建了一个端到端的肺癌诊断框架。该系统的核心优势在于能够自动学习CT图像中的关键特征,减少对人工特征工程的依赖,同时通过智能优化算法显著提升分类精度和计算效率。
关键技术方法概述
研究采用SPIE-AAPM-NCI公共肺部CT数据集,通过自适应滤波去噪和双阈值分割预处理后,利用深度卷积神经网络(DCNN)提取空间特征,结合长短期记忆网络(LSTM)捕捉序列依赖性。创新性地引入马群优化算法(HHO)和狮子优化算法(LOA)混合优化器,自动调谐LSTM超参数(包括LSTM单元数、学习率、丢弃率等),在保证98.75%准确率的同时将CPU利用率控制在4.64%,推理时间优化至150.1秒。
肺癌分类系统的整体架构
研究团队设计了一个包含四个关键阶段的处理流程:图像预处理、病灶分割、特征提取和优化分类。预处理阶段采用自适应中值滤波器有效消除CT图像中的噪声干扰,同时通过直方图均衡化增强图像对比度。分割阶段使用自适应双阈值法,基于[90-140 HU]的亨氏单位阈值范围精准分离病灶区域与正常组织。
DCNN-LSTM混合模型的特征学习机制
该研究的核心创新在于构建了DCNN与LSTM的协同学习框架。DCNN部分采用多层卷积核结构,通过卷积运算(公式3)和ReLU激活函数提取从边缘纹理到高级形态学的多层次特征。池化层(公式4-5)则通过降维操作保留关键特征的同时控制模型复杂度。LSTM组件通过遗忘门(公式6)、输入门(公式7)和输出门(公式10)等门控机制,有效学习特征序列中的长程依赖关系,从而提升对良恶性结节的鉴别能力。
混合优化算法的超参数调谐策略
HHO-LOA混合优化器通过平衡探索与利用,实现了超参数的智能优化。HHO算法模拟马群社会行为,在探索阶段(公式13)进行全局搜索,在利用阶段(公式14)进行局部精细调优。LOA算法则借鉴狮子捕猎策略,通过咆哮机制(公式15)和狩猎机制(公式16)增强收敛效率。混合优化器通过多目标适应度函数(公式17)同时优化分类精度和计算成本,其中权衡参数λ经网格搜索确定为0.7,实现了准确率与计算效率的最佳平衡。
模型性能的全面评估
在五折交叉验证中,模型表现出卓越的稳定性和泛化能力,平均准确率达到99.42%(±0.21%)。ROC曲线和精确率-召回率曲线分析显示,模型在结节水平的AUC值达到1.00,表明其具备完美的分类判别能力。针对数据集存在的类别不平衡问题(良性结节80%,恶性结节20%),研究团队采用SMOTE过采样、类别权重调整和数据增强等策略,有效提升了模型对少数类(恶性结节)的识别能力。
消融实验与对比分析
通过系统的消融实验,研究验证了各模块的贡献度。完整模型(DCNN+LSTM+HHO+LOA)达到98.75%的准确率,而单独使用DCNN+Softmax或仅结合单一优化算法的模型性能显著下降,证实了混合架构的必要性。与现有先进模型对比中,HHO-LOA-DCNN-LSTM在准确率(99.65%)、精确率(99.75%)、召回率(99.23%)和F分数(98.89%)等指标上均优于GW-CTO-DNN、FPSO-CNN等对比模型。
模型校准与不确定性分析
研究还深入分析了模型的校准性能,提出的DCNN+LSTM模型在Brier分数(0.042)、期望校准误差(ECE=2.8%)和对数损失(0.154)等指标上均优于对比模型,表明其预测概率具有高度可靠性。针对误分类案例的分析发现,边缘不规则良性结节和小尺寸低对比度恶性结节是主要错误来源,为此团队提出了基于置信度阈值(0.45-0.55)的不确定性感知报告机制,为临床人机协作提供了重要参考。
研究结论与临床意义
该研究通过创新性地融合生物启发式优化算法与深度学习架构,成功开发了一个高效、准确的肺癌自动分类系统。HHO-LOA混合优化器有效解决了深度学习模型超参数调优的难题,DCNN-LSTM混合架构则充分利用了空间特征和序列依赖性的互补优势。模型在保持高精度的同时显著降低了计算资源需求,使其具备了临床部署的可行性。
尽管该模型在标准数据集上表现出色,研究团队也坦诚指出了其局限性,包括对输入图像质量的依赖性以及较高的计算资源需求。未来工作将聚焦于模型轻量化、多中心验证以及集成学习策略的探索,进一步提升模型的实用性和泛化能力。
这项研究为肺癌早期诊断提供了一种新的技术范式,其提出的混合优化深度学习框架不仅适用于肺癌分类,也为其他医学影像分析任务提供了可借鉴的方法论。随着医疗人工智能的不断发展,这种融合生物智能与人工智慧的诊断工具有望成为放射科医生的得力助手,为提升肺癌早期检出率和诊断准确性做出重要贡献。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号