一种结合注意力机制的轻量级深度学习模型,用于高血压性视网膜病变的分类
《International Journal of Cardiology Cardiovascular Risk and Prevention》:A Lightweight Deep Learning Model with Attention Mechanisms for Hypertensive Retinopathy Classification
【字体:
大
中
小
】
时间:2025年11月09日
来源:International Journal of Cardiology Cardiovascular Risk and Prevention 2.1
编辑推荐:
MA-DNet是一种结合DenseNet与通道和空间注意力机制的高血压视网膜病变轻量级分类模型,通过Gaussian加权去噪和CLAHE对比增强优化数据,采用几何变换与过采样解决类别不平衡问题。实验表明,MA-DNet在OIA-ODIR数据集上达到95.8%的准确率,敏感性为85.2%,模型参数仅7.33M,较传统方法减少37%复杂度,并在Raspberry Pi 4上实现2.3秒/图像的推理速度。
高血压视网膜病变(Hypertensive Retinopathy, HR)是一种常见的高血压并发症,其特征在于视网膜血管的逐渐损伤,严重威胁患者的视力健康与生活质量。由于HR的早期识别对于及时干预和减缓疾病进展至关重要,因此开发一种高效、准确的自动诊断系统成为当前医学影像研究的重要方向。然而,传统方法依赖于眼科医生对视网膜图像的手动评估,这种方法不仅耗时,而且容易受到主观判断的影响,导致诊断不一致和误诊率较高。特别是在医疗资源有限的地区或大规模筛查场景中,这种局限性尤为明显,进一步加剧了漏诊和误诊的问题。因此,迫切需要一种自动化、客观的HR分类系统,以缓解眼科资源分配不均带来的临床不平等现象。
为了应对上述挑战,本文提出了一种轻量级的双注意力网络模型——MA-DNet。该模型结合了DenseNet架构与通道和空间注意力机制,旨在提升HR分类的准确率和泛化能力。DenseNet以其密集连接结构著称,能够有效缓解深度神经网络中常见的梯度消失问题,并通过多尺度特征重用增强模型对微血管病理特征的识别能力。然而,传统DenseNet在HR分类任务中仍存在一定的局限性,尤其是在面对复杂的病理表现和数据不平衡问题时。为此,MA-DNet引入了通道和空间注意力模块,通过动态分配计算资源,优化特征提取过程,从而在保持模型轻量化的同时,显著提升分类性能。
在数据准备与预处理阶段,研究团队使用了OIA-ODIR数据集以及其它公开的医学影像资源。该数据集包含来自多个医疗机构的异质性视网膜图像,涵盖了包括糖尿病视网膜病变(DR)、青光眼、年龄相关性黄斑变性(AMD)在内的多种眼病。为了确保数据的一致性,研究团队实施了一系列标准化处理步骤,包括图像尺寸统一、灰度转换、二值化处理以及Canny边缘检测,用于提取视网膜区域。此外,还采用了直方图均衡化等图像增强技术,以提高图像对比度,突出病变区域。考虑到数据集中的类别不平衡问题,即HR样本仅占约3.4%,研究团队通过几何变换(如旋转和翻转)和随机过采样策略,对HR样本进行了增强,从而实现训练数据的平衡。这些预处理措施不仅提升了模型对病变特征的识别能力,还减少了因图像异质性和噪声干扰带来的误判风险。
在模型设计方面,MA-DNet基于DenseNet-121架构,这是DenseNet系列中较为高效的一种变体。该模型在DenseBlock之间插入了Transition Layer模块,用于控制特征图的维度并减少计算复杂度。此外,研究团队在模型中集成了SENet和CBAM两种注意力机制,分别用于通道特征的重新校准和空间特征的优化。SENet模块通过全局特征压缩和门控机制,对通道特征进行动态加权,以突出重要的病理标记物,同时避免过拟合。CBAM模块则结合了通道注意力和空间注意力,通过并行最大值和平均值池化操作,生成通道注意力权重,随后通过卷积层对空间特征进行融合,形成具有位置敏感性的掩码。这种双路径设计使得模型能够在通道和空间两个维度上优化特征表达,从而更准确地捕捉到HR相关的病变特征,如微动脉瘤和棉絮斑等。
在实验分析中,研究团队对MA-DNet模型进行了全面评估。结果显示,该模型在OIA-ODIR数据集上达到了95.8%的分类准确率,显著优于现有的其他方法。同时,模型的敏感度(Sensitivity)和特异度(Specificity)分别达到了85.2%和96.3%,表明其在识别HR病例和排除非HR图像方面表现出色。此外,模型仅包含733万参数,相比传统方法减少了37%的计算复杂度,这使得其在边缘计算设备上的部署成为可能。在实际应用中,该模型在Raspberry Pi 4设备上的单张图像推理时间约为2.3秒,适合在资源有限的基层医疗机构中使用,为临床提供便捷、高效的诊断支持。
研究团队还对不同注意力模块的贡献进行了详细分析。结果表明,单独引入SENet模块可将敏感度提升3.4%,而CBAM模块则在抑制背景干扰方面表现优异。当两者结合使用时,模型的准确率提升了6.2%,验证了注意力机制在HR分类任务中的关键作用。此外,研究团队对其他知名的视网膜疾病诊断系统进行了比较,例如用于糖尿病视网膜病变(DR)分类的Gulshan模型、Abramoff模型、Gargeya与Leng模型以及Ting模型。尽管这些系统在DR筛查任务中表现出色,但它们主要针对DR特有的病变特征,如微动脉瘤和渗出物,而HR的病变特征包括棉絮斑和血管异常等,与DR存在显著差异。因此,MA-DNet在HR分类任务中具有独特的优势,其准确率和敏感度均优于现有的DR分类系统,同时保持了模型的轻量化特性。
在模型优化过程中,研究团队对多个关键超参数进行了调整,包括学习率、训练轮次、批量大小、损失函数和优化器。学习率的设定对模型的收敛速度和稳定性至关重要,过高可能导致训练过程不稳定,而过低则会显著延长训练时间。因此,选择了初始学习率为0.001,结合随机梯度下降(SGD)优化器和动量参数(momentum=0.9),以实现高效的参数更新。训练轮次设置为80次,批量大小为16,这些参数的组合在保证模型性能的同时,降低了计算资源的消耗。损失函数采用分类交叉熵(Categorical Cross-Entropy),能够有效衡量模型预测结果与真实标签之间的差异,从而指导模型的训练过程。
通过实验结果的可视化分析,研究团队进一步验证了MA-DNet模型的性能。在训练过程中,模型的准确率随着训练轮次的增加而持续上升,而在验证阶段,准确率在第64轮达到峰值,之后继续训练对模型性能的提升效果有限,表明模型已基本收敛。同时,训练损失和验证损失均呈现出持续下降的趋势,进一步说明模型在学习过程中表现稳定,能够有效避免过拟合现象。最终测试结果显示,模型在HR分类任务中的准确率达到95.8%,显著优于传统方法,且在识别早期HR病例时表现出较高的敏感度。然而,模型在识别早期阶段的微动脉瘤时仍存在一定的误判风险,表现为两个假阴性(False Negative)案例。这提示未来的研究需要进一步探索如何提升模型对早期病变的识别能力,例如通过引入长期观察数据或结合其他生物标志物进行多模态分析。
MA-DNet模型的成功不仅在于其在分类任务中的优异表现,还在于其在实际临床场景中的应用潜力。该模型能够在保持高准确率的同时,大幅降低计算复杂度,使其具备在资源有限的医疗环境中部署的能力。此外,通过数据增强和预处理技术,模型有效缓解了数据不平衡问题,提升了对罕见病变的识别能力。这些改进使得MA-DNet成为一种可行的自动化诊断工具,尤其适用于无法获得专业眼科设备的基层医疗机构。未来,研究团队计划进一步优化模型,探索其在不同设备和环境下的适应性,同时考虑引入更多的临床数据以增强模型的泛化能力。
总体而言,MA-DNet模型为高血压视网膜病变的自动诊断提供了一种新的解决方案。通过结合DenseNet的密集连接特性与通道和空间注意力机制,该模型在提升分类准确率的同时,保持了较低的计算复杂度和较高的可部署性。实验结果表明,MA-DNet在识别HR相关病变方面表现出色,能够有效应对现有方法在数据不平衡、病变多样性以及模型轻量化等方面的不足。这一研究不仅推动了高血压视网膜病变的自动化诊断技术的发展,也为实现更公平、更高效的医疗资源分配提供了技术支持。未来,随着人工智能技术的不断进步,类似MA-DNet的模型有望在更多医疗场景中得到应用,为提升疾病筛查效率和降低误诊率做出更大贡献。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号