
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于自适应性双注意力机制CNN-LSTM网络的COVID-19胸部X光影像诊断系统研究
【字体: 大 中 小 】 时间:2025年06月06日 来源:Array 2.7
编辑推荐:
本研究针对RT-PCR检测灵敏度不足及医疗资源受限的临床痛点,创新性提出融合自适应性卷积块注意力模块(SA-CBAM)和多头注意力机制(MHA)的Dual-Attention CNN-LSTM模型。通过分析15,000例胸部X光片,模型在三分类任务中实现99.97%的加权准确率,为COVID-19早期诊断提供高精度AI解决方案。
在COVID-19全球大流行的背景下,RT-PCR检测面临灵敏度波动(低至60-70%)和资源分配不均的严峻挑战。胸部X光(CXR)因其非侵入性、低成本等优势成为重要替代方案,但传统卷积神经网络(CNN)难以捕捉医学影像中的时序特征,而单纯长短期记忆网络(LSTM)又缺乏空间特征提取能力。马来西亚理工大学的研究团队在《Array》发表的研究中,创新性地构建了Dual-Attention CNN-LSTM混合架构,通过集成自适应性卷积块注意力模块(Self-Adaptive CBAM)和多头注意力机制(Multi-Head Attention),在15,000例三分类任务中实现99.97%的准确率,为临床决策提供了突破性AI工具。
研究采用三大技术路线:首先对来自COVID-19 Radiography Database等公开数据集的15,000张CXR进行16种图像增强处理;其次设计SA-CBAM模块动态调整通道与空间注意力顺序,通过辅助网络计算特征图均值实现自适应;最后在LSTM层后引入MHA机制,通过8个并行注意力头捕捉长程依赖。实验采用5折交叉验证,以Matthews相关系数(MCC)等6项指标评估性能。
【图像增强技术筛选】
系统比较HE、CLAHE等16种增强方法,发现多尺度视网膜增强(MSR)效果最佳,使基线CNN-LSTM准确率提升至99.78%。MSR通过模拟人类视觉的色觉恒常性,有效突出COVID-19特征性毛玻璃影(GGO)。
【SA-CBAM机制验证】
提出的SA-CBAM通过阈值判定(θ=0.5)动态切换注意力顺序,当特征图均值>0.5时优先执行通道注意力。消融实验显示,7×7卷积核配合该模块使分类F1-score达99.85%,较传统CBAM提升0.7%。
【跨模型性能对比】
在相同数据集上,Dual-Attention CNN-LSTM以99.97%准确率超越DarkNet53+FPN(99.61%)等8个基线模型。特别在样本失衡场景(COVID-19仅占14.3%),模型仍保持92.18%的召回率,显著优于常规CNN-LSTM的87.65%。
【临床实用性分析】
模型对AP位(患者仰卧位拍摄)低质量CXR具有鲁棒性,能识别三种典型病变:外周分布的GGO(敏感性99.2%)、肺实变(98.7%)和网状阴影(97.9%)。与放射科医师双盲测试显示,AI辅助诊断时间缩短68%。
该研究通过双注意力机制创新性地解决了医学影像时空特征融合的难题。SA-CBAM模块的参数自适应特性使其在资源受限地区更具实用价值,而MHA机制对疾病进展的时序建模为预后评估提供了新思路。未来可通过联邦学习整合多中心数据,进一步验证模型的泛化能力。研究不仅为COVID-19诊断树立了新标杆,其架构设计更为其他医学影像分析任务提供了可复用的技术范式。
生物通微信公众号
知名企业招聘