编辑推荐:
为提升结肠息肉检测能力,中国计量大学研究人员开展基于改进 YOLOv5s 算法的研究,结果显示改进模型检测性能提升,为计算机辅助诊断系统提供基准314
结肠息肉检测新突破:改进 YOLOv5s 算法成效显著
在健康的赛道上,癌症始终是人们避之不及的 “拦路虎”,尤其是结直肠癌,它在全球癌症发病率和死亡率排行榜上都名列前茅。在中国,结直肠癌的形势也不容乐观,新发病例数逐年上升。早期结直肠癌患者如果能及时治疗,生存率可超 90%,但到了晚期,生存率会急剧下降到 10 - 20% 。这就凸显出早期筛查的重要性,而结肠息肉作为结直肠癌的重要 “前身”,对其进行精准检测成为了早期筛查的关键1。
以往,医生主要依靠结肠镜检查来发现结肠息肉,但这种方法存在明显弊端。诊断结果很大程度上依赖医生的经验和操作水平,医生一旦疲劳或者经验不足,就容易出现漏诊、误诊的情况。就好比在复杂的迷宫中寻找宝藏,如果没有精准的地图和足够的耐心,很容易与宝藏失之交臂。所以,开发一种更精准、高效的结肠息肉检测技术迫在眉睫。
为了解决这一难题,中国计量大学机电工程学院等机构的研究人员展开了深入研究。他们把目光聚焦在人工智能领域的目标检测算法上,致力于改进 YOLOv5s 算法,期望借此提升结肠息肉的检测能力,为结直肠癌的早期诊断提供有力支持,进而推动计算机辅助诊断系统的发展23。
在研究过程中,研究人员采用了多种关键技术方法。他们从公开数据库中精心挑选了大量真实的消化内镜图像,这些图像来自 [Kvasir - SEG]、[CVC - ClinicDB]、[LDPolypVideo] 等,包含了 609 张患病肠道图像和 2000 张正常肠道图像。随后,他们利用 LabelImg 软件对图像进行标注,为后续的模型训练做准备。在模型构建方面,他们引入了注意力机制(SE)对 C3(Cross Stage Partial Networks)模块进行升级,将其变为 C3SE(Cross Stage Partial Networks with Squeeze - and - Excitation),以此增强模型对关键特征的捕捉能力。同时,运用双向特征金字塔网络(BiFPN)优化多尺度特征融合,让模型能更好地整合不同尺度的信息456。
实验设计与结果
- 实验数据集:研究人员从多个公开数据库中随机抽取图像,构建了包含患病肠道和正常肠道的图像数据集。这些图像经过裁剪和缩放处理,统一为 640×640 分辨率。数据集按照 8:2 的比例划分为训练集和验证集,另外 195 张图像作为测试集78。
- 模型评估指标:研究采用混淆矩阵、准确率(Accuracy)、召回率(Recall)、精度(Precision)、平均精度均值(mAP)等指标来评估模型性能。其中,混淆矩阵通过真阳性(TP)、假阴性(FN)、假阳性(FP)和真阴性(TN)来反映模型的分类情况,进而计算出其他评估指标910。
- 实验结果与分析:研究人员通过对比实验,探究不同 C3 层升级为 C3SE 对模型性能的影响。结果发现,将第一和第二个 C3 层升级为 C3SE 时,模型的各项指标表现最佳,mAP0.5比原始模型高 1%,精度高 2.39%,召回率高 0.34%。在此基础上,研究人员进一步将 BiFPN 融入模型,构建了 YOLOv5s + SEBiFPN 模型。与原始 YOLOv5s 模型相比,该改进模型在 mAP、准确率和召回率上分别提升了至少 1.6%、1.3% 和 1.5%。5 折交叉验证实验表明,YOLOv5s + SEBiFPN 模型稳定性极佳,mAP 的变化仅为 0.4%,精度变化为 0.5%。不过,研究也发现,在处理复杂场景中的息肉,如被肠壁遮挡、形状扁平的息肉时,模型仍存在一定局限性111213。
研究结论与展望
通过一系列实验,研究人员成功改进了 YOLOv5s 算法,增强后的 YOLOv5s + SEBiFPN 模型在结肠息肉检测方面展现出强大的实力,不仅检测能力提升,计算复杂度还保持在较低水平,优于其他同类检测算法。这一成果为计算机辅助诊断系统的发展提供了重要的技术基准,有望在临床实践中发挥重要作用,帮助医生更精准、高效地检测结肠息肉,为结直肠癌的早期诊断提供有力支持141515。
然而,研究人员也清楚地认识到研究存在的局限性。在极端光照条件、息肉过小或模糊、存在遮挡等挑战性场景下,模型的性能会受到影响。未来,他们计划进一步优化模型,提升其在复杂场景下的鲁棒性。同时,研究人员还考虑将该方法拓展应用到其他医学成像领域,如肺部或皮肤病变检测,探索其更广泛的适用性。相信随着研究的不断深入,这一技术将为生命科学和健康医学领域带来更多惊喜和突破。