编辑推荐:
为解决肺结节检测中对小目标不敏感、检测精度低等问题,研究人员开展 LN-DETR(Lung Nodule DETR)模型研究。结果显示该模型提升了检测性能,在减少参数和计算量同时提高了准确率,对肺结节检测意义重大。
在医疗领域,肺癌如同隐藏在暗处的 “杀手”,其发病率和死亡率增长迅速,是导致癌症相关死亡的主要原因之一。多数肺癌患者确诊时已处于晚期,五年生存率仅在 10 - 20% 左右。而肺结节作为肺癌的早期迹象,若能在早期被精准检测出来并及时治疗,患者生存率可超 50%。然而,目前肺结节检测面临诸多挑战。肺结节大小不一,小的结节因与背景纹理相似且在图像中占比极小,极易被忽视;其形状和边缘复杂多样,包括实性、部分实性和磨玻璃样结节等,这使得检测模型难以全面捕捉特征;而且肺结节密度常与周围正常组织相近,像磨玻璃样结节,其与周围组织对比度低,模型很容易漏检。此外,传统检测算法泛化能力差,复杂的图像背景,如 CT 扫描中的血管、肺泡和肺纹理等,也严重干扰模型训练,不同患者肺部结构差异以及肺部疾病导致的背景纹理变化,进一步增加了检测难度。
为攻克这些难题,杭州师范大学信息科学与技术学院的研究人员展开了深入研究,他们提出了 LN-DETR(Lung Nodule DETR)模型 ,相关研究成果发表在《Scientific Reports》上。这一研究成果意义非凡,有望为肺结节检测带来新的突破,提高检测的准确性,助力肺癌的早期诊断,从而挽救更多患者的生命。
研究人员主要采用了以下关键技术方法:首先是设计了轻量级的 FasterBlock 模块,对骨干网络进行优化,减少计算量和参数数量的同时增强特征提取能力;其次,构建了 Deep and Shallow Detail Fusion(DSDF)模块,有效融合浅层和深层的跨尺度特征;还提出了 Joint Context Feature(JCF)模块,改进网络的下采样功能,利用上下文信息重新加权特征,提升检测精度。研究使用公开的 LUNA16 数据集进行实验,该数据集源自 LIDC-IDRI,经过处理后用于模型的训练、验证和测试。
实验结果
- 数据集介绍:研究使用 LUNA16 数据集,它是 LIDC-IDRI 的子集,包含 888 例低剂量肺部 CT 扫描。由于原始 CT 图像无法直接用于训练神经网络,研究人员将其转换为 PNG 格式,并通过深度学习方法分割肺实质,排除周围骨骼和肌肉的干扰。同时,为增强模型性能,对 1186 个肺结节图像进行数据增强,扩展到 3813 个图像,随后按 70%、10%、20% 的比例划分为训练集、验证集和测试集。
- 实验设置:实验使用 Intel Xeon CPU E5 - 2650 v3 2.30GHz 处理器、16GB 内存、1TB 硬盘和 12GB 显存的 RTX 3060 GPU,在 Windows 10 系统上运行,基于 PyTorch 框架,利用 CUDA v11.8 和 CuDNN v8.9 进行 GPU 加速。训练参数设置为:批量大小为 8,初始学习率 0.0001,最终学习率 1.0,动量 0.9,训练 300 轮,且不使用预训练权重。
- 评估指标:实验采用精度(Precision,P)、召回率(Recall,R)、交并比(Intersection over Union,IoU)为 0.5 时的平均精度均值(mean Average Precision at IoU is 0.5,mAP@0.5)、IoU 从 0.5 到 0.95 步长为 0.05 时的平均精度均值(mAP@0.5:0.95)、参数总数、浮点运算数(Floating - point Operations,FLOPs)和每秒帧数(Frames Per Second,FPS)等指标进行评估。
- 与现有方法对比:将 LN-DETR 与多种主流目标检测网络对比,结果显示,LN-DETR 在检测精度上优势明显,其 mAP@0.5 和 mAP@0.5:0.95 分别比最新的 YOLOv9 高 5.3% 和 3.6% ,在精度、召回率、mAP@0.5 和 mAP@0.5:0.95 这四个指标上均超过其他对比算法。在计算成本方面,与计算成本最低的 MFDS-DETR 相比,LN-DETR 的 FLOPs 减少了 2.1G ,与基线模型 RT-DETR 相比减少了 6.1G ,展现出更好的计算效率。
- 消融研究和模块比较
- 消融研究:以 RT-DETR 模型为基线,分别添加不同模块进行实验。结果表明,FasterBlock 模块可提高检测精度,减少参数和计算量;DSDF 模块能有效利用深浅层语义信息,提升 mAP;JCF 模块解决了下采样过程中的特征丢失问题,提高了精度。LN-DETR 整合各模块优势,与 RT-DETR 相比,精度提高 3.5%,召回率提高 8.2%,mAP@0.5 提高 6.4%,mAP@0.5:0.95 提高 2.9% ,且参数和计算量略有减少。
- 模块比较:与其他特征提取模块相比,FasterBlock 在计算负载和参数数量上优势显著;与其他特征融合模块相比,DSDF 在检测精度上表现更优,mAP@0.5 提高 3.9% ,mAP@0.5:0.95 提高 1.1% ;与其他下采样模块相比,JCF 检测精度大幅提升,mAP@0.5 提高 3.8% 。
- 统计分析:从 LUNA16 数据集随机选取 100 张图像(RT-DETR 和 LN-DETR 各 50 张)进行独立样本 t 检验,结果显示 LN-DETR 与 RT-DETR 有显著差异,且 LN-DETR 平均精度更高,在实际检测中表现更优。
- 定性结果:对比多个模型和 LN-DETR 在 LUNA16 数据集上的检测结果,YOLOv9 和 RT-DETR 在肺结节检测中存在漏检、误检和精度低等问题,而 LN-DETR 通过优化特征融合和下采样架构,对肺结节的检测灵敏度更高,在误报率和检测精度上表现出色。此外,LN-DETR 在不同噪声条件下具有一定的抗性,对关键目标区域的关注度更高,能更好地捕捉微小肺结节特征。
研究结论和讨论
研究提出的 LN-DETR 模型有效解决了肺结节检测中对小目标检测不敏感和整体检测精度低的问题。通过 FasterBlock 模块改进骨干网络,提升了特征提取能力,减少了计算量和参数;DSDF 模块增强了跨尺度特征融合能力;JCF 模块通过重新加权目标区域特征,提高了检测性能。实验结果表明,LN-DETR 在检测精度上有显著提升,同时在计算效率上也有一定优化。
然而,LN-DETR 仍存在一些局限性。在 fps 指标上表现不佳,实时性能有待提高;虽然在减少模型参数和计算复杂度方面取得一定成果,但优化程度还不够,无法带来质的飞跃。此外,不同数据集特性不同,需要在更多样化的数据集上测试,验证算法在不同临床环境中的鲁棒性和适应性;目前仅研究了 LN-DETR 在肺结节检测中的性能,其在其他医学目标检测任务中的表现尚不明确,需要进一步拓展研究。未来研究应聚焦于提升检测精度、实时性能,降低模型硬件要求,优化网络结构,以实现性能和计算效率的更好平衡。