
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于双流Transformer-CNN的EmiNet模型在光学内窥镜图像中实现细菌运动模式精准分割与检测
【字体: 大 中 小 】 时间:2025年07月27日 来源:Computers in Biology and Medicine 7.0
编辑推荐:
针对肺炎诊断中光学内窥镜(OEM)图像细菌实时检测的挑战,研究人员开发了集成Transformer与CNN的双流网络EmiNet,创新性地提出多模态跨通道注意力(MMCCA)模块融合运动与形态特征,结合合成数据生成策略,在真实和合成数据集上实现Dice分数0.862,检测相关性提升6.8%,为临床快速诊断提供新工具。
肺炎作为由细菌感染引发的呼吸道疾病,在重症监护中具有高致死率,其治疗关键依赖于肺部深处细菌的快速精准检测。然而,现有X射线和CT等影像技术需48-72小时才能出结果,而光学内窥镜(OEM)虽能实时获取活体光学活检图像,但海量图像的实时人工分析存在巨大挑战。更棘手的是,标注医学图像需要极高专业成本,导致监督学习所需的标注数据极度匮乏。
针对这一系列难题,来自英国爱丁堡大学(University of Edinburgh)的研究团队在《Computers in Biology and Medicine》发表了突破性研究。他们创新性地开发了EmiNet双流网络架构,通过结合3D CNN的局部特征提取能力和Transformer的全局建模优势,同时引入合成数据生成策略,实现了无需真实标注数据的细菌运动模式精准检测。研究采用合成数据生成(基于高斯形状细菌模型和随机运动算法)、双流特征提取(外观流与光流运动流)、多模态跨通道注意力(MMCCA)融合等关键技术,在1350组合成序列和真实临床数据上验证了模型性能。
方法创新与结果
3.1 EmiNet架构
研究构建的编码器-解码器结构包含并行的外观流(处理原始OEM序列)和运动流(处理光流序列),通过3D CNN下采样后经Transformer捕获长程依赖,最终通过MMCCA模块实现运动指导下的特征融合。实验显示,加入运动流使Dice分数提升1.1%,MMCCA模块进一步将性能提升至0.862。
4.1 合成数据验证
通过模拟两种细菌运动模式(持续移动的Motion Pattern 1和间歇出现的Motion Pattern 2),结合真实无细菌OEM背景生成的合成数据,在视觉图灵测试中被专家误判率高达67.7%,证实其高度逼真性。
5.2 性能比较
在合成数据测试中,EmiNet以0.862 Dice分数超越所有对比模型,其中对UNETR的领先幅度达27.4%。真实数据测试显示,其检测数量与医生标注相关性达0.892,较现有最佳无监督方法提升6.8%,FPPF(每帧误报数)最低仅0.68。
结论与展望
该研究通过EmiNet的创新架构和合成数据策略,首次实现了OEM序列中细菌运动模式的端到端学习,其MMCCA模块被证明能有效提升运动特征的表征能力。特别值得注意的是,仅使用合成数据训练的模型在真实数据上表现优异,这为医疗AI面临的标注数据稀缺问题提供了新解决思路。研究者指出,未来将通过优化Transformer计算效率来提升实时性,推动该技术向临床落地迈进。
生物通微信公众号
知名企业招聘