基于云计算的结核分枝杆菌智能检测系统:YOLOv5深度学习算法在结核病诊断中的创新应用

《BMC Infectious Diseases》:Automated detection of mycobacterium tuberculosis based on cloud computing

【字体: 时间:2025年11月20日 来源:BMC Infectious Diseases 3

编辑推荐:

  本研究针对结核病诊断依赖医生经验、效率低下的问题,开发了基于云计算的结核分枝杆菌自动检测方法。研究人员利用Kaggle数据库的9963个标注数据,在九天平台上采用YOLOv5深度学习算法构建疾病检测模型,实现了94.80% mAP50、93.72%准确率和91.24%召回率的优异性能,为结核病诊断提供了高效准确的AI辅助工具。

  
结核病(Tuberculosis, TB)作为一种由结核分枝杆菌引起的传染性疾病,至今仍是全球重大的公共卫生挑战。据世界卫生组织《2022年全球结核病报告》显示,2021年有600万至1000万人感染结核病,其中100万至600万人死于该疾病,使其成为全球主要死因之一。令人震惊的是,全球约四分之一的人口(约17亿人)感染了结核分枝杆菌,其中传染性最强的肺结核主要通过空气传播,当感染者咳嗽或打喷嚏时,病菌就会扩散。
目前,结核病的诊断依赖医学史、体格检查和实验室检查的综合评估。结核分枝杆菌培养被视为诊断的"金标准",这一过程需要采集患者痰液进行培养并进行抗酸染色(acid-fast staining)以确定细菌存在。然而,这种方法不仅耗费大量人力和物力资源,其准确性还很大程度上取决于医生的经验水平。在医疗资源匮乏的地区,这一挑战尤为突出。
随着人工智能技术的快速发展,特别是深度学习在医学影像分析领域的突破,为结核病的自动诊断带来了新的希望。深度学习作为机器学习的一个分支,通过构建包含互连节点的人工神经网络,能够自动学习数据特征并进行预测和决策。近年来,AI在医学临床应用中取得了显著进展,从斯坦福大学开发的皮肤癌诊断移动应用,到德克萨斯大学西南医学中心的ConvPath算法用于肺癌细胞识别,再到2024年Chadaga等人提出的基于三维卷积神经网络的阿尔茨海默病检测方法,都展示了AI在医学诊断中的巨大潜力。
然而,这些深度学习模型在临床疾病诊断中虽然表现出色,但其所需的巨大计算能力和较长的推理时间对快速检测构成了重大挑战。正是在这样的背景下,丁雪梅等研究人员在《BMC Infectious Diseases》上发表了他们的研究成果,探索基于云计算平台的结核分枝杆菌自动检测方法。
本研究主要采用了以下几个关键技术方法:从Kaggle数据库获取1265张抗酸染色涂片的9963个标注数据;在中国移动九天云计算平台上使用YOLOv5深度学习算法进行特征提取和模型训练;采用遗传算法优化超参数;将训练集和验证集按7:3比例划分,比较不同模型网络(YOLOv5n、s、m、l、x)在300和600训练轮次下的性能;最后利用Flask框架和Vue.js开发前后端系统实现模型部署。
数据分布
研究人员对上传数据的分布特征进行了详细分析,发现图像大小集中在0.4-0.5MB之间,边界框的纵横比集中在0.201-1.547范围内,边界框大小集中在379.2-5815.2像素之间,且边界框数量通常不超过10个。这些分布特征为后续模型训练和优化提供了重要参考。
模型训练结果
研究结果显示,不同模型网络和训练参数对训练效果和时长有显著影响。当训练轮次为300时,YOLOv5x表现最佳,达到94.80% mAP50、93.72%准确率和91.24%召回率,训练时间为7小时40分钟40秒;而YOLOv5m表现最差,各项指标均较低,但训练时间较短。当训练轮次增加至600时,YOLOv5n取得最佳结果,而YOLOv5x的性能反而下降,这表明过长的训练可能导致过拟合。
超参数探索
通过遗传算法对YOLOv5x的超参数进行优化,研究人员发现了一系列关键参数的最佳配置。图像HSV增强参数为hsv_h=0.088、hsv_s=0.547和hsv_v=0.23;图像变换相关参数如degrees=0.0267、translate=0.0127、scale=0.892等也经过了优化调整。这些优化后的超参数组合显著提升了模型的泛化能力。
模型部署
研究团队利用云平台提供的在线预测功能,成功实现了对新样本的快速检测。选择在300训练轮次下训练的YOLOv5x模型进行部署,该模型能够快速准确地检测抗酸染色阳性的结核分枝杆菌。
通过Flask框架和Vue.js技术,研究人员构建了一个完整的云检测平台,用户可上传图像并与原图进行比较,实现了模型的本地和云端双部署方案。
在讨论部分,研究人员深入分析了深度学习在疾病诊断中的应用价值。与传统深度学习算法相比,YOLOv5采用更高效的架构,允许在多个尺度上并行执行目标检测,大幅提升检测速度。其轻量级模型相比传统算法对硬件设备要求更低,改进的检测框架使其能够进行快速准确的检测,适用于高通量病原体检测。
研究还发现,不同预训练权重模型针对不同医学问题的表现存在差异。批量大小(batch size)和训练轮次(epochs)的设置对模型性能有重要影响:批量过大可能导致过拟合,过小则训练速度慢;训练轮次过少模型欠拟合,过多则泛化能力下降。除这些参数外,YOLOv5还有一系列超参数需要优化,包括初始化学习率、动量(momentum)、权重衰减等,以及数据增强参数,这些设置都对训练速度和最终效果有特定影响。
基于云计算的智能医学研究有望减轻医院本地服务器的存储和计算压力,促进不同机构间的交流合作,为医生和研究人员提供更便捷的诊断和研究工具。然而,作者也指出AI目前只能部分替代人类的某些工作,医学是高度严谨的学科,AI模型常被称为"黑箱",其结果通常缺乏可解释性。提高敏感性和特异性是AI临床应用领域必须面对的问题,通过提高样本标注质量、增加样本量、应用数据增强策略以及进一步优化模型结构和超参数,有望在未来进一步提升模型效果。
该研究成功利用YOLOv5深度学习算法,结合云计算平台,建立了结核分枝杆菌检测模型,表现出快速的检测能力。这一研究成果为医生提供了准确高效的结核病在线诊断工具,推动了人工智能在临床诊断中的应用发展,为未来智能医疗系统的建设提供了重要参考。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号