《Journal of Membrane Science》:Multi-class deep learning architecture for COVID-19, tuberculosis, and pneumonia classification using chest X-ray images
编辑推荐:
基于CNN的胸部X光片多类疾病分类模型研究,提出VGG-19架构通过SMOTE数据增强和图像预处理解决类别不平衡问题,在6000张样本上达到97.5%测试准确率。
Sameer Srivastava|Eshanee Ghosh|Abhinav Kumar|Parthiv Chahar|Arpit Utkarsh|Raghavendra Mishra
印度中央邦博帕尔-因多尔高速公路科特里卡兰,VIT博帕尔大学计算科学工程与人工智能学院,邮编466114
摘要
医学成像和深度学习的进步使得智能系统的开发成为可能,这些系统能够协助临床医生诊断复杂的肺部疾病。本研究关注由COVID-19、结核病(TB)和肺炎等疾病引起的肺部异常问题。我们提出了一种基于卷积神经网络(CNN)的多类分类框架,该框架利用胸部X光图像自动检测COVID-19、结核病、肺炎和正常状态。原始的公开数据集存在类别不平衡问题,COVID-19病例的数量明显少于其他类别。为了解决这个问题,在特征层应用了合成少数样本过采样技术(SMOTE),生成了一个包含6000张胸部X光图像的平衡数据集,这些图像在四个类别中均匀分布。我们采用了多种预处理技术来提升模型的泛化能力,包括图像标准化、增强和调整大小。我们评估了多种深度学习架构,包括ResNet-50、EfficientNet和VGG-19。其中,VGG-19的测试准确率最高,达到97.5%,其精确度、召回率和F1分数均超过96%。这个统一的深度学习流程整合了数据预处理、特征提取和分类环节。所提出的模型目前仍处于研究阶段,不具备临床应用能力,但它展示了巨大的潜力,未来可以进一步探索其在辅助放射科医生进行诊断决策方面的作用。
引言
像肺炎、结核病(TB)和COVID-19这样的呼吸系统疾病继续对全球公共卫生构成重大挑战[1]。这些肺部感染通常不能仅通过胸部X光(CXR)成像直接诊断;相反,CXR图像通常需要结合其他诊断方法和专家解读。准确的解读需要专业的放射学知识,而这在偏远地区可能并不总是具备的。延迟或错误的诊断可能导致患者治疗结果不佳。
在这种情况下,人工智能(AI)和机器学习(ML)技术已成为提高诊断准确性和效率的强大工具。这些基于AI的工具在构建自动分析医学图像的系统中发挥着关键作用[2]。深度学习(DL)模型,特别是卷积神经网络(CNN),在医学图像分类任务中表现出色,包括图像重建、增强、去噪和疾病检测等[3]、[4]。DL模型可以从大型数据集中学习复杂特征,非常适合识别CXR图像中健康肺部与受特定疾病影响肺部的差异。
本研究的动机源于现有多类分类方法的局限性:(1)由于数据分布不均,少数类别(如COVID-19)的性能不足[5];(2)由于标记数据集有限,诊断准确率较低;(3)传统模型在区分病毒性肺炎和COVID-19等密切相关疾病时效率低下。
为了解决这些问题并确保正确诊断肺部异常同时最小化误诊的可能性,本文提出了一种使用胸部X光图像对COVID-19、结核病和肺炎进行分类的多类深度学习架构。该DL模型旨在帮助医疗专业人员(放射科医生)将CXR图像分为四个类别:COVID-19、肺炎、结核病和正常[6]。该系统基于VGG-19 CNN架构构建,并与ResNet-50、EfficientNet和DenseNet等著名模型进行了对比评估[7]、[8]。
我们的目标不是取代临床诊断,而是提供一种辅助决策支持工具,帮助识别潜在的肺部异常以供进一步专家审查[9]。从临床角度来看,COVID-19是一种病毒性肺炎,而结核病的症状也可能与细菌性肺炎相似[10]。因此,自动分类模型在区分这些情况时面临固有的挑战[5]。此外,该模型专门针对上述疾病进行了训练,并未考虑其他胸部异常情况,如气胸、心脏扩大、医疗设备移位等。
所提出的VGG-19模型提高了分类准确性,尤其是在COVID-19和结核病等代表性不足的类别中[11]。该模型利用数据增强和合成少数样本过采样技术(SMOTE)来平衡数据集。这些技术有助于生成少数类别的合成样本并减少训练偏差[12]。这种方法提升了模型性能并减少了训练过程中的偏差。该系统展示了高准确性、可扩展性以及在实际决策支持系统中的应用潜力。该模型使用了准确性、精确度、召回率和F1分数等指标,与ResNet-50、EfficientNet和DenseNet等流行深度学习架构进行了基准测试。
本文的结构如下:“文献综述”部分介绍了相关研究,“方法论”部分描述了研究方法,“提出的多类分类架构和实现”部分重点介绍了实现细节,“结果与分析”和“结论”部分分别讨论了结果分析和结论。
部分摘录
文献综述
深度学习的出现显著提高了利用医学成像数据对疾病进行分类和预测的能力[13]。许多研究集中在涉及四个类别的多类分类上:正常、肺炎、结核病和COVID-19。本研究采用了类似的方法,利用卷积神经网络(CNN)、数据增强技术和VGG19、ResNet-50、EfficientNet、DenseNet等先进架构来实现多类疾病分类
方法论
深度学习的出现显著提升了利用医学成像数据对疾病进行分类和预测的能力[6]、[25]。本文提出了一种使用高精度CNN模型进行胸部X光图像分类的多类分类方法。所提出的模型旨在将图像分为四个不同的类别:正常、肺炎、结核病和COVID-19。为了提高性能并解决类别不平衡问题,该模型结合了几种关键技术
提出的多类分类架构和实现
所提出的模型设计用于将CXR图像分类为四个类别:肺炎、结核病(TB)、COVID-19和正常。图5展示了用于检测肺部疾病的多层次分类模型的架构。该系统包括几个关键阶段,包括数据预处理、数据增强、数据集分割和模型训练。每个组件都对提升模型性能起着关键作用
结果与分析
本研究提出了一种多类分类算法,旨在利用胸部X光图像识别COVID-19、结核病(TB)、肺炎和正常状态。所提出的方法采用了深度学习技术,主要使用迁移学习。在测试的模型中,VGG-19的测试准确率最高,达到97.5%,优于ResNet-50、DenseNet和EfficientNet。表1展示了VGG-19模型的评估指标,而图6则展示了
局限性
本研究使用的数据集存在不平衡问题,COVID-19样本的数量明显少于其他类别。尽管在特征层应用了SMOTE技术来缓解这种不平衡,但医学成像中的现实世界变异性仍然是一个挑战。此外,本研究使用的数据集来自不同的来源[41]、[42],这可能会无意中引入与潜在病理无关的特定数据集偏差。如果这种偏差存在,可能会影响模型性能
结论
本文提出了一种基于深度学习的强大多类分类框架,用于利用胸部X光图像自动检测COVID-19、结核病(TB)和肺炎病例。通过利用卷积神经网络(CNN)架构,所提出的模型有效解决了在具有重叠放射学特征的多种肺部疾病之间进行区分的挑战。我们对几种最先进的CNN模型进行了比较分析