
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于深度学习信息融合与牛顿-拉夫森优化算法的无线胶囊内镜图像胃肠道疾病分类研究
【字体: 大 中 小 】 时间:2025年09月02日 来源:Scientific Reports 3.9
编辑推荐:
本研究针对胃肠道疾病诊断中存在的观察者差异和小病灶漏诊问题,开发了一种结合改进深度学习模型与牛顿-拉夫森控制海洋捕食者算法(NRMPO)的计算机辅助诊断系统。研究人员通过融合Top-hat/Bottom-hat滤波增强对比度,创新性地提出熵场传播(EFP)层替代传统池化层,在Kvasir V1/V2和Hyperkvasir数据集上分别取得99.0%、89.6%和82.7%的分类准确率,为早期胃肠道疾病诊断提供了高效自动化解决方案。
在消化道疾病诊断领域,传统胃镜检查存在侵入性强、难以检测小肠病变等局限性,而新兴的无线胶囊内镜(WCE)技术虽然能获取全消化道图像,却面临图像质量不均、诊断效率低下等问题。据统计,美国2020年预计新增27,600例胃癌病例,死亡人数达11,010例,凸显早期准确诊断的紧迫性。现有计算机视觉方法在特征提取时易产生冗余信息,且多数研究受限于图像分辨率不一致导致的黑色边框干扰,这些瓶颈严重制约着临床诊断效率。
针对这些挑战,Saddaf Rubab等研究者提出创新性解决方案,通过融合改进的深度学习架构与智能优化算法,在《Scientific Reports》发表的研究中实现了胃肠道疾病的高精度自动分类。该研究采用三阶段技术路线:首先通过Top-hat/Bottom-hat滤波融合进行图像增强;随后改造ResNet18/50网络结构,用原创的熵场传播(EFP)层替代传统池化层;最后应用牛顿-拉夫森控制的海洋捕食者算法(NRMPO)优化特征选择,并通过均值阈值融合策略集成多模型特征。
研究团队选用Kvasir V1/V2和Hyperkvasir三个公开数据集,包含8-23类胃肠道病变图像。采用数据增强技术(水平/垂直翻转、90度旋转)解决样本不平衡问题。创新性提出EFP层通过空间softmax、局部熵计算和可学习门控机制保留空间信息。特征优化阶段引入NRMPO算法改进适应度函数,最终通过新型均值阈值融合方法整合ResNet18/50的特征向量,输入10种机器学习分类器进行评估。
研究采用Ψc1(m,n)=Bth+Tth公式融合Top-hat和Bottom-hat滤波,显著提升低对比度WCE图像质量。如图3所示,经处理的图像能清晰显示病变区域细节,为后续分析奠定基础。数据增强阶段通过公式I(m,n)Rot90实现图像旋转等变换,有效扩充训练样本量。

研究团队对ResNet18/50进行两项关键改进:1)用EFP层替代传统池化层,其通过公式EFPd(c,k)=∑Kd(m-c,n-k)·∮d(m,n)·wd(m,n)实现空间信息动态加权;2)采用NRMPO算法优化特征选择过程。如图5所示,EFP层通过局部熵计算自适应调整特征传播权重,使网络更关注低熵(高确定性)区域。

研究提出创新的均值阈值融合方法,通过公式Ffu(k)=Flength(i)≥m筛选有效特征。如表8所示,融合后的特征在线性SVM分类器上达到99.0%的准确率,较单模型提升显著。Wilcoxon符号秩检验证实(ω=0≤ωcrit=8),该方法在Kvasir V1/V2数据集上的性能差异具有统计学意义。
如图13所示,Grad-CAM可视化显示模型能准确聚焦息肉、溃疡等病变区域。消融实验(图14)证明均值阈值融合较传统串联融合准确率提升1-3%。在HyperKvasir数据集测试中,ResNet50+EFP达到84.57%准确率,较基线提升2.6%,验证了方法的泛化能力。

该研究通过EFP层和NRMPO算法的创新结合,解决了WCE图像分类中的特征冗余和空间信息丢失问题。实验表明,该方法在保持较高计算效率(最快97.48秒)的同时,显著提升多类病变识别准确率。未来研究可探索端到端训练架构,并开发针对特定胃肠道疾病的专用网络模型。该成果为临床胃肠病自动化诊断提供了可靠的技术路径,对实现消化道肿瘤早期筛查具有重要意义。
生物通微信公众号
知名企业招聘