基于深度学习与视觉Transformer的新型X射线数据集在呼吸系统疾病诊断中的突破性应用

【字体: 时间:2025年06月10日 来源:Computers in Biology and Medicine 7.0

编辑推荐:

  为解决呼吸系统疾病诊断中数据集单一性和模型泛化能力不足的问题,研究人员系统综述了2017-2024年深度学习(DL)与视觉Transformer(ViT)在X射线影像分析中的应用,并构建了涵盖49种肺部疾病、7867张影像的新数据集。该研究通过对比公开数据集性能指标(准确率、F1值等),证实新数据集显著提升模型临床适用性,为AI驱动诊断提供重要数据基础。

  

呼吸系统疾病如肺炎和COVID-19的快速准确诊断一直是临床难题。尽管计算机辅助诊断(CAD)系统自1970年代开始发展,但传统规则基方法和有限数据集导致诊断准确率受限。随着深度学习(DL)技术崛起,特别是视觉Transformer(ViT)在医学影像中的应用,为疾病诊断带来新机遇。然而现有公共数据集普遍存在病种覆盖狭窄、样本量不足等问题,严重制约模型泛化能力。

为解决这一瓶颈,University of Hail的研究团队Amer Alghadhban等人开展了系统性研究。通过分析2017-2024年间DL与ViT在呼吸系统疾病诊断中的应用现状,发现当前数据集仅涵盖肺炎、结核等少数病种,导致模型易出现过拟合。研究团队创新性地收集了来自3家医院的7867张X射线影像,覆盖49种肺部疾病和5263例患者,构建迄今最全面的呼吸系统疾病影像数据集。该成果发表于《Computers in Biology and Medicine》,为AI辅助诊断树立了新标杆。

关键技术包括:1) 系统文献综述法筛选2017-2024年DL/ViT相关研究;2) 评估NIH Chest X-ray等5个公共数据集的模型性能指标;3) 构建含49类疾病的新型临床数据集;4) 采用卷积神经网络(CNN)和ViT进行对比实验。

【相关工作】
综述表明,传统CAD系统受限于规则基方法的刚性,而DL模型通过分层特征提取显著提升诊断精度。ViT因其全局注意力机制,在病灶定位方面超越传统CNN。

【高级DL模型总结】
研究发现,深度神经网络通过非线性处理可捕捉复杂影像特征,网络深度与诊断准确率呈正相关。ViT在COVID-19检测中达到96.2%准确率,较CNN提升7.3%。

【现有数据集分析】
对比COVID-Xray等数据集发现,现有资源平均仅覆盖3-5种疾病,且样本量不足万例。新数据集病种数量达现有资源的16倍,有效缓解数据偏差问题。

【模型性能比较】
实验显示,在新数据集上ViT模型的F1-score达0.923,较公开数据集平均提升0.15。迁移学习策略使小样本疾病分类准确率提高22%。

【临床数据集构建】
来自King Khalid Hospital等机构的7867张影像,经专业标注形成多层级标签体系,包含像素级分割标注和病灶坐标信息。

【挑战与限制】
研究指出临床应用的三大障碍:影像质量差异(约23%需人工清洗)、标注成本高(单图平均耗时15分钟)、模型可解释性需求。

结论部分强调,该研究通过构建大规模多样化数据集,使DL模型在罕见病诊断中的准确率提升至89.7%。讨论指出,未来需开发多模态融合架构,整合电子健康档案(EHR)与实验室数据。这项成果不仅填补了呼吸系统疾病AI诊断的数据空白,更验证了ViT在医学影像中的优越性,为临床决策支持系统发展奠定基础。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号