使用机器学习技术预测并改善南非结核病诊疗效果

《PLOS Global Public Health》:Predicting and improving diagnosis of tuberculosis outcomes in South Africa using machine learning techniques

【字体: 时间:2025年11月09日 来源:PLOS Global Public Health 2.5

编辑推荐:

  结核病诊断与机器学习应用研究在南非的实践。基于全国收入动态调查(NIDS)数据,采用随机森林、支持向量机等六种机器学习模型,分析16项自报告特征对结核病的预测效果。结果显示,梯度提升机(SGBM)和逻辑回归(LR)模型在敏感性和F1分数上表现最优,分别达到91.32%和96.80%。研究证实机器学习可有效提升资源受限地区的结核病诊断准确率,为全球结核病防控提供技术方案。

  南非的卫生与社会福利部在应对结核病(TB)方面做出了重要努力,这些努力以国家针对艾滋病、性传播疾病(STIs)和结核病的战略计划为指导。然而,由于依赖于低效的诊断方法,TB的预防和根除工作进展受到了严重阻碍。本研究旨在利用机器学习技术预测并改善南非的TB诊断。研究数据来源于南非国家收入动态调查(NIDS),该调查由南方非洲劳动与社会发展研究单位(SALDRU)进行。数据集被分为70%的训练数据和30%的测试数据,用于训练随机森林(RF)、决策树(DTs)、支持向量机(SVMs)、梯度提升机(GBMs)、人工神经网络(ANNs)和逻辑回归(LR)等六种机器学习模型。通过超参数调优和基于杂质的指标,变量的重要性得到了排序。结果显示,随机森林模型在敏感性上达到了87.50%,F1分数为92.5%;决策树模型则达到了90.92%的敏感性和93.01%的F1分数;人工神经网络模型的敏感性为81.72%,F1分数为87.53%;梯度提升机(SGBMs)的敏感性为91.32%,F1分数为94.55%;支持向量机(SVMs)的敏感性为90.03%,F1分数为97.72%;逻辑回归(LR)的敏感性为96.55%,F1分数为96.80%。机器学习技术,其准确率超过80%,为提升南非TB预测和诊断提供了重要的机会。这种预测方法可能在资源有限的环境中,包括撒哈拉以南非洲(SSA)地区,具有显著的应用价值。

结核病仍然是全球公共卫生面临的重要挑战之一,每年报告的新病例超过1000万,2022年记录的死亡人数约为170万。尽管在诊断和治疗方面取得了显著进展,但TB传播的复杂性以及临床表现的多样性仍然对及时和准确的检测构成了障碍。这一挑战在东南亚和非洲地区尤为突出,因为这些地区的因素如共感染、耐药性和社会决定因素增加了问题的复杂性。因此,需要创新的方法来有效控制TB疾病。在TB负担较高的国家,如南非,其影响不仅限于个人健康,还波及整个社区,给卫生系统带来了沉重的压力。因此,实现《终结TB战略》中列出的全球目标,需要在治疗和预防措施上取得改进,同时在TB诊断方法上实现根本性的转变。

近年来,机器学习在TB诊断和治疗中的应用展现出巨大的潜力。研究表明,深度学习在分类TB患者的X光图像方面具有更高的准确性,有助于早期发现和亚型区分。例如,Sharma等人利用机器学习分析TB耐药性特征,指导靶向治疗策略。Acharya等人则采用逐步调整方法训练模型进行自动TB诊断,并结合优化的归一化网络(NFNets)和Score-Cam算法,以突出胸部X光图像中的特定区域,进行详细推断。这些学术成果表明,机器学习和人工智能(AI)在现实临床环境中的应用价值。随着TB诊断方法的不断演进,机器学习算法如朴素贝叶斯、k近邻、支持向量机和人工神经网络,已被用于预测结核杆菌在rpoB、inhA、katG、pncA、gyrA和gyrB基因中对利福平、异烟肼、吡嗪酰胺和氟喹诺酮类药物的耐药性,平均准确率约为85%。此外,决策树模型在预测TB时表现出最高准确率,达到74.1%。因此,机器学习方法在提升TB诊断和预测方面具有显著的应用前景。

南非在全球TB相关报告和研究中占据重要地位。2020年,世界卫生组织(WHO)更新了全球TB负担最严重的30个国家名单,其中包括南非。南非在这些国家中,TB报告病例数居第三,患者人数居第五。同时,南非在TB与HIV共感染病例中排名第一,达到81,800例,而多药耐药TB(MDR-TB)病例数居第二,达到7,100例。尽管南非在2023年TB病例有所减少,但该国仍承担着全球TB负担的相当一部分,这使得创新方法的必要性更加凸显。Osman等人最近研究了南非TB相关死亡的系统性驱动因素,并提供了关于健康系统因素如何影响疾病流行的重要见解。然而,他们的分析中存在一个关键的空白,即缺乏对创新技术干预的探索,这可能是由于其方法论上的限制。因此,有必要在现有文献的基础上进行深入研究,以提高TB检测和识别的准确性,确保受影响个体能够及时接受治疗,并推动在TB防控方面的研究和开发。

本研究的目标是提出机器学习方法,以预测和改善南非的TB诊断结果。从根本上讲,本研究旨在弥合对TB死亡系统性驱动因素的理解与实施创新干预措施之间的差距,从而改善TB的诊断环境,并为实现到2030年减少TB发病率和疾病负担的全球目标提供可行的建议。通过利用全国代表性的数据,我们采用五种经过验证的机器学习模型,以提高TB诊断和预测的准确性。除了个体层面的干预,本研究还推动了系统性思维在项目设计和资源分配方面的应用。此外,通过改革现有的以患者为中心的决策框架,促进纠正措施的实施,也可能得到增强。在本研究中,我们使用了十六种非侵入性的个人信息,包括自述的血咳、持续咳嗽、糖尿病、腹泻、高血压、中风、癌症、年龄、酒精消费、心脏问题、发热、吸烟、严重体重减轻、自我评估的健康状况以及胸痛,以精确区分参与者中的TB状态。

在预测练习中,我们采用了RF、DTs、SGBMs、ANN和SVMs等模型。考虑到数据的不平衡性(1:26),我们通过F1分数来评估模型表现,所有模型在这一指标上都表现出相对良好的性能。我们还发现,所有模型的AUC值均超过60%(见图4)。然而,尽管使用了网格搜索优化技术,集成模型如RF和SGBMs在准确性和敏感性上仍然优于ANN和SVMs。这可能是因为我们的数据结构中存在非线性关系。例如,SVMs和ANN模型在数学上可能难以有效映射预测变量到响应变量。此外,集成模型如RF和SGBMs在处理噪声数据、异常值和小样本效应方面具有更强的鲁棒性。总体而言,本研究展示了机器学习在提升临床评估、识别和预测TB方面的潜力,尤其是在撒哈拉以南非洲(SSA)地区,TB的发病率仍然较高。此外,研究结果为实际应用提供了多种可能性,包括通过数字化融合加快筛查、建立临床决策支持系统以及通过试点测试与利益相关者合作。

尽管研究结果显示出较高的敏感性和F1分数,但特定性相对较低,这在高度不平衡的疾病数据中是常见的现象。尽管决策树模型在准确性和特定性方面表现良好,但SGBMs在敏感性和F1分数上表现出更优的结果,表明其更强的鲁棒性。当然,SGBMs是目前最稳健的模型之一,有时甚至优于深度学习模型,因此在与单棵树决策模型相比时,其优越性并不令人意外。除了预测结果,理解变量对模型性能的贡献对于制定预防策略也至关重要。例如,识别TB的最关键预测因素可以帮助临床医生针对最易受影响的流行病学和人口学群体,从而实现更有效的资源分配。在所有集成模型(RF和SGBMs)和ANN中,持续咳嗽、健康状况和年龄都被认为是区分TB状态的重要因素。这一发现与其他研究相吻合,例如,一项临床研究发现,24小时咳嗽频率与TB阳性痰涂片状态之间存在统计学显著关联(p=0.04)。此外,Patterson和Wood最近的一项综述发现,咳嗽本身并不一定是传播的机械原因,但与显著的感染性有关。因此,持续咳嗽和血咳可能作为TB感染的潜在标志。此外,持续出汗、发热和疲劳是TB的显著临床症状。因此,这些因素可能共同定义人们的健康状况,从而成为预测模型中的重要特征。年龄也被所有模型认为是一个关键变量。

尽管算法模式识别和模型复杂性可能会影响变量重要性的排名,但大多数模型中健康状况作为前三重要因素的一致性表明其在TB临床识别中的关键作用。这在一定程度上是预期的,因为面临多种健康问题的人群,包括传染性和非传染性疾病,通常会比没有这些疾病的人群更倾向于认为自己的健康状况较差。此外,我们发现,在DT模型中,中风是最重要的预测因素之一。中风可能通过复杂的免疫抑制机制增加吞咽困难和吸入风险,从而提高TB的患病风险。然而,我们也需要强调,TB与中风之间的联系并非直接,而是高度依赖于其他潜在的健康状况,如糖尿病和高血压。因此,在本研究中,对这一关联的因果解释应谨慎进行。我们还发现,胸痛和发热在几乎所有模型中都起到了中等程度的预测作用。因此,发热的严重程度在某些情况下被用来评估抗TB药物的效果。在数据约束的情况下,我们没有对额外肺部TB进行子组分析,因为额外肺部TB占南非TB病例的15%。因此,对特定类型的TB进行外推时应保持谨慎。此外,由于测试数据集存在极端的类别不平衡,报告的准确率可能具有误导性,因为其主要由多数类别(无TB)决定。因此,读者在评估模型时,应更加关注多种指标,包括敏感性、特定性、F1分数、AUC和平衡准确率。尽管模型在敏感性和F1分数上表现较好,但其特定性较低,这在不平衡的临床数据背景下是众所周知的挑战。这一局限性强调了将机器学习方法作为辅助决策工具的必要性,而不是完全替代临床判断。为了减少误报的潜在后果,模型输出应与现有的确认诊断方法相结合,例如GeneXpert检测和胸部X光检查。此外,为了确保这些模型在不同医疗环境中持续可靠和适应性强,定期校准和外部验证将是必要的。

综上所述,TB仍然是发展中国家面临的重要公共卫生挑战,南非也不例外。为了通过预测和诊断TB来提升临床实践,我们开发了五种已知的机器学习模型,并对其效率进行了比较。我们使用了十六种非侵入性的个人特征进行预测,并发现基于树的模型(如SGBMs、DTs和RFs)以及L2正则化的逻辑回归(LR)模型优于ANN和SVMs。然而,基于准确性和敏感性,所有模型均达到了70%以上的准确率和敏感率,其中SGBMs、LR和RFs在敏感性、特定性、AUC和准确率指标上均表现出令人满意的性能。本研究对于改善TB的诊断、预防和管理具有重要意义,无论是短期还是长期。通过这些模型,我们可以更有效地识别高风险TB患者,从而采取积极的应对措施。此外,这些模型还可以用于识别设施或地理层面的热点区域,以标记活跃病例,并实现接触者追踪。在资源有限的环境中,由于缺乏足够的筛查工具,初步筛查通常基于症状,这可能导致较高的误诊率。因此,结合人口统计学和临床数据的机器学习模型有望提高敏感性并减少漏诊率。通过进一步的验证和解决相关限制,这些模型可以在非洲其他面临类似挑战的国家中得到推广和应用。为了确保这一决策支持系统能够更准确地反映不同国家和时间段的流行病学特征,本研究可以作为扩展和应用的基准,结合多中心数据,并调整可能限制空间泛化能力的地理混杂因素。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号