使用深度学习对越南的胸部X光片中的异常情况进行分类,以早期发现心肺疾病
《Frontiers in Radiology》:Classifying abnormalities in chest radiographs from Vietnam using deep learning for early detection of cardiopulmonary diseases
【字体:
大
中
小
】
时间:2025年11月20日
来源:Frontiers in Radiology 2.3
编辑推荐:
越南本土胸片AI分类模型研究:基于12827正常和4644异常病例,采用ViT与EfficientNetV2特征提取结合LightGBM分类器,5折交叉验证下F1-score 0.668,特异性0.931,AUC 0.897,有效辅助早期检测传染性与非传染性心肺疾病,缓解医疗资源短缺问题。
在越南,尽管近年来非传染性疾病的死亡率有所上升,但与发达国家相比,传染性疾病的负担依然沉重。这表明,改善越南的公共卫生和环境卫生,对于应对包括传染性和非传染性在内的多种疾病具有重要意义。胸部X光检查是用于检测心肺疾病的重要工具,因其广泛可用、成本效益高、能够检测多种疾病且辐射剂量较低而被广泛应用。然而,目前针对越南数据集开发的AI模型仍处于空白状态,这使得在该国早期识别心肺异常变得困难。因此,本研究旨在利用越南的胸部X光数据,开发一种AI系统,以实现对正常与异常图像的准确分类。
### 背景与重要性
越南近年来在非传染性疾病方面面临日益严峻的挑战,而传染性疾病的高发病率更是凸显了其公共卫生系统的压力。根据2021年的数据,心肺疾病是越南死亡率最高的疾病之一,其中包括缺血性心脏病、慢性阻塞性肺病(COPD)、肺部肿瘤、肺结核和新冠肺炎等。这些疾病的高死亡率不仅影响个体健康,也对国家医疗体系造成巨大负担。在东南亚和南亚地区,心肺疾病是导致死亡的主要原因之一,尤其在缺乏先进影像设备(如CT扫描仪)的医疗中心,胸部X光成为唯一可行的影像检查手段。
在这样的背景下,AI技术的应用显得尤为重要。AI不仅可以提高诊断的效率,还能在资源有限的情况下帮助医疗工作者更好地识别潜在的健康问题。目前,已有大量研究致力于通过胸部X光图像检测心肺疾病,但大多数模型是基于特定疾病的诊断,如肺炎、肺结核、肺癌等,而较少关注整体的正常与异常分类。此外,许多现有AI系统在训练数据上存在偏差,要么过度偏向异常病例,要么缺乏对传染性和心血管疾病的充分代表性,这在实际应用中可能造成误诊或漏诊。
越南作为一个具有双重疾病负担的国家,其医疗数据的独特性使得基于本地数据开发的AI模型在临床实践中更具实用价值。因此,本研究选择越南的胸部X光数据集作为训练材料,开发一种能够有效区分正常与异常图像的AI系统,以期在该国的医疗环境中发挥更大的作用。
### 研究方法
本研究采用了回顾性分析的方法,收集了来自越南两家机构——Medic Medical Center和MEDICEN Co., Ltd.的胸部X光图像。这两家机构均位于胡志明市,拥有较为丰富的临床数据资源。数据采集遵循了伦理审查标准,符合《赫尔辛基宣言》的要求,并获得了日本国立健康与福利大学的伦理审查批准(批准号:19648-250819)。此外,研究也遵循了诊断准确性报告的标准(STARD指南),以确保研究的透明性和可重复性。
研究数据包括18,280例患者,其中包含与影像资料相关的临床信息。在数据预处理阶段,所有胸部X光图像均被转换为PNG格式,并进行了标准化处理。为了提高图像质量,研究人员对图像的像素值进行了线性缩放和归一化处理,使其达到8位深度,同时调整了对比度以适应黑色遮挡框(black-box masking)带来的影响。图像的大小被统一调整为224×224像素,以保持原始比例。对于采用MONOCHROME1格式的图像,研究人员进行了像素反转处理,以确保图像在后续分析中保持一致性。
在模型开发方面,研究团队使用了两种主流的深度学习方法:Vision Transformer(ViT)和EfficientNetV2。ViT是一种基于Transformer架构的图像分类模型,能够捕捉图像中的全局特征。EfficientNetV2则是一种轻量级的卷积神经网络(CNN),在保持较高性能的同时,具有较低的计算成本。为了进一步提高模型的泛化能力,研究人员还对原始图像进行了主成分分析(PCA),以提取更高效的图像特征。通过PCA,研究人员将ViT提取的384维特征和EfficientNetV2提取的1,280维特征分别压缩到4、8、16、32、64、128和256维,以探索不同特征维度对模型性能的影响。
模型的训练采用了5折交叉验证的方法,以确保结果的稳定性。在训练过程中,研究团队使用了Optuna工具(版本4.3.0)对LightGBM分类器进行参数优化。LightGBM是一种基于梯度提升的高效机器学习算法,适用于大规模数据集的分类任务。研究人员通过调整树模型的数据数量、深度、特征选择方法、学习率和L1/L2正则化参数,以获得最佳的分类效果。最终,模型在5,000次迭代中进行了训练,并在10轮后提前终止,以避免过拟合。
为了评估模型的性能,研究团队使用了多种指标,包括F1分数、灵敏度、特异性、准确率和曲线下面积(AUC)。此外,研究还分析了在固定灵敏度(0.90和0.95)和特异性(0.90和0.95)水平下的分类效果。所有异常胸部X光图像均被标记为18种预定义的疾病,以计算每种疾病的真阳性率(true positive fraction, TPF)。这些疾病包括肺不张、慢性阻塞性肺病、感染性肺部疾病、间质性病变、肺部肿瘤、胸腔积液、肺炎、气胸、肺气肿、肺结核、心血管疾病、支气管扩张、纵隔肿瘤、骨折、骨骼肌异常、胸壁塌陷、旧疤痕及其他。通过这种细分分析,研究团队能够更全面地评估模型在不同疾病类型中的表现。
### 研究结果
经过严格的训练和验证,该AI模型在分类任务中表现良好。在最佳特征维度设置下(即256维),模型的F1分数达到了0.668(95%置信区间:0.656–0.681),灵敏度为0.596(95%置信区间:0.582–0.610),特异性为0.931(95%置信区间:0.927–0.936),准确率为0.842(95%置信区间:0.837–0.848),AUC值为0.897(95%置信区间:0.892–0.902)。这些指标表明,模型在区分正常与异常胸部X光图像方面具有较高的临床价值。
进一步的子组分析显示,模型在不同类型的疾病中均表现出较高的准确率。在感染性疾病的分类中,模型对肺部感染的TPF为0.917,对肺炎的TPF为0.885,均在特异性为0.90的情况下取得较好的效果。这说明模型在识别感染性肺部疾病方面具有较强的判断能力,这在越南这样一个传染病高发的国家尤为重要。对于非传染性疾病,模型在检测间质性病变、气胸和肺不张等具有广泛影像表现的疾病时,TPF分别为0.923、0.800和0.944,同样表现出较高的准确性。此外,模型在识别急症(如气胸和纵隔肿瘤)时也显示出较高的性能,这有助于快速识别需要紧急处理的病例。
在固定灵敏度和特异性水平的分析中,模型在保持较高特异性的同时,能够识别出大部分异常病例。例如,在特异性为0.90的情况下,模型对感染性疾病的TPF为0.691,对急症的TPF为0.719,这表明模型在实际应用中能够有效地筛选出需要进一步检查的病例。然而,模型在某些特定疾病的识别上仍有提升空间,尤其是在心血管疾病和肺部肿瘤等局部病变的检测中,真阳性率相对较低。这可能是由于这些疾病的影像表现较为细微,或者在训练数据中缺乏足够的代表性。
### 讨论与意义
本研究开发的AI模型在越南胸部X光数据集上的表现优于之前基于非越南数据的模型。例如,Nguyen等人开发的AI系统在越南数据集上的F1分数为0.653,准确率为0.796,而本研究的模型在相同数据集上的F1分数为0.668,准确率为0.842,显示出更高的诊断能力。此外,与印度的AI系统相比,本研究的模型在灵敏度和特异性方面也表现出较好的性能。例如,Nabulsi等人开发的AI系统在印度数据集上的灵敏度为0.63,特异性为0.91,AUC为0.87;而Govindarajan等人评估的qXR算法在印度数据集上的灵敏度为0.879,特异性为0.829,AUC为0.871。相比之下,本研究的模型在AUC、灵敏度和特异性方面均表现更优,特别是在固定特异性为0.90的情况下,灵敏度达到了0.691,特异性为0.719,显示出良好的平衡能力。
在实际应用中,AI模型的高特异性意味着它能够有效地排除大部分正常病例,从而减少不必要的进一步检查。而较高的灵敏度则表明,模型能够识别出大部分异常病例,避免漏诊。特别是在急症和感染性疾病的检测中,模型的高准确率使其成为一种有价值的辅助工具。对于越南这样一个医疗资源有限的国家,AI系统的引入可以显著提升诊断效率,缓解医疗人员短缺带来的压力。
然而,模型在某些疾病的识别上仍存在局限。例如,心血管疾病和肺部肿瘤的TPF相对较低,这可能与这些疾病的影像特征较为复杂,或者训练数据中缺乏足够的样本有关。此外,模型在识别多个病变的病例时也表现出一定的挑战,因为不同病变的影像特征可能相互干扰,影响模型的判断。因此,未来的研究应致力于扩大数据集的多样性,提高模型对复杂病变的识别能力。
### 临床应用前景
在临床实践中,AI模型可以作为辅助诊断工具,帮助医生快速筛查胸部X光图像,识别可能的异常情况。特别是在资源有限的地区,AI系统能够显著提高诊断效率,减少医生的工作负担。此外,AI模型的高负预测值(negative predictive value, NPV)为0.952,这意味着在模型判断为正常的情况下,绝大多数病例确实属于正常,这有助于减少误诊带来的风险。
本研究的AI模型不仅适用于越南,还可能在其他东南亚国家(如菲律宾和柬埔寨)发挥重要作用。这些国家同样面临医疗资源短缺和疾病负担沉重的问题,而AI系统的引入可以为它们提供有效的诊断支持。此外,随着技术的不断发展,AI模型的性能仍有进一步优化的空间。例如,通过增加训练数据的多样性,提高模型对局部病变的识别能力,以及优化特征提取方法,可以进一步提升模型的准确率。
### 结论
本研究成功开发了一种基于越南胸部X光数据集的AI模型,能够有效区分正常与异常图像,并在多种疾病类型中表现出较高的准确率。该模型在感染性疾病和急症的检测中尤为突出,显示出其在越南等传染病高发地区的应用潜力。尽管在某些局部病变的识别上仍有改进空间,但该系统已经具备在临床环境中作为辅助诊断工具的条件。未来的研究应继续优化模型,以提高其对各种疾病的检测能力,并推动其在更广泛的医疗环境中应用。通过AI技术的引入,越南的医疗系统有望在提高诊断效率的同时,降低医疗成本,改善患者预后。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号