基于临床血液学数据的可解释机器学习模型DengueStackX-19:提升登革热诊断准确性与临床实用性

《Healthcare Analytics》:An Interpretable Machine Learning Model for Dengue Detection with Clinical Hematological Data

【字体: 时间:2025年11月05日 来源:Healthcare Analytics CS4.4

编辑推荐:

  本研究针对登革热快速准确诊断的临床需求,开发了一种名为DengueStackX-19的新型可解释机器学习框架。该研究利用来自孟加拉国Jamalpur综合医院的1,523例临床验证患者数据,通过综合应用多种重采样技术(如SMOTEENN)处理数据不平衡问题。研究结果表明,DengueStackX-19模型在SMOTEENN平衡策略下,通过10折交叉验证达到了96.38%的准确率和94.20%的F1分数,显著优于传统机器学习模型。研究还集成了SHAP和LIME等可解释AI技术,增强了模型的临床可解释性,并成功部署为基于Web的诊断平台,为资源有限地区的登革热早期诊断提供了有力工具。

  
登革热,这种由蚊子传播的病毒性疾病,至今仍是全球范围内的重大公共卫生挑战。尤其是在热带和亚热带地区,登革热的威胁尤为严峻。世界卫生组织的数据显示,过去50年间,登革热感染病例增加了30倍,全球约有一半人口面临感染风险。截至2025年7月,已有超过90个国家和地区报告了300多万病例,造成1,400多人死亡。
孟加拉国在2025年经历了近年来最严重的登革热疫情之一。截至7月初,该国报告了11,954例实验室确诊病例和45例死亡病例,发病率和死亡率均较往年显著上升。与以往疫情主要集中在首都达卡不同,此次疫情已蔓延至全国,农村和半城市地区占病例总数的75%以上。疫情扩散的背后是多种因素的交织:病媒控制措施执行不力、都市圈外医疗设施不足导致早期诊断和治疗延迟、公众预防意识薄弱,以及季节性季风降雨为蚊子繁殖创造了理想环境。
传统的登革热诊断方法往往依赖于环境变量,缺乏患者层面的精确性,限制了其在临床中的应用。近年来,机器学习技术在医学研究中展现出巨大潜力,为疾病预测和诊断提供了可扩展的方法。然而,现有研究存在明显局限:过度依赖宏观层面或基于症状的数据,对血液学生物标志物的探索不足;可解释人工智能技术的应用有限,影响了临床医生的信任度;缺乏适合低资源医疗环境的实时可部署系统。
为了应对这些挑战,来自Daffodil国际大学软件工程系的Izaz Ahmmed Tuhin等研究人员开展了一项创新性研究,开发了一种名为DengueStackX-19的新型机器学习框架。该研究聚焦于血液学参数作为早期登革热检测的更可靠指标,旨在提高诊断准确性、减少决策时间,并改善患者预后,特别是在资源有限的环境中。
研究人员开展了一项系统性的研究,主要采用了以下几个关键技术方法:研究团队从孟加拉国Jamalpur 250床综合医院收集了1,523例经临床验证的患者记录,包含19项临床和血液学参数;数据经过严格的预处理,包括标签编码、异常值检测与消除、特征标准化,并应用多种重采样技术处理类别不平衡问题;研究提出了一种新颖的DengueStackX-19堆叠集成模型,该模型整合了随机森林、决策树、支持向量机、K近邻和LightGBM等基础学习器,并使用逻辑回归作为元学习器;通过10折交叉验证评估模型性能,采用准确率、精确率、召回率、F1分数等多种指标进行全面评估;应用SHAP和LIME等可解释AI技术增强模型透明度;最后开发了基于Web的诊断平台,实现模型的临床部署。
4.1. 重采样技术对模型性能的影响
研究比较了六种数据平衡设置下的模型性能,包括无平衡、SMOTE、SMOTETomek、ADASYN、Tomek Links和SMOTEENN。结果表明,DengueStackX-19在所有设置下均表现出最强且最稳定的性能。在SMOTEENN策略下,该模型达到了93.65%的准确率和89.63%的F1分数,相较于不平衡模型准确率提高了17.13%。在分类性能评估中,DengueStackX-19在SMOTEENN下实现了96.38%的准确率和94.20%的F1分数,错误率最低,明显优于SVM和LGBM等基线模型。
4.2. 含异常值样本与不含异常值样本的性能比较
异常值去除显著提高了所有模型的性能。DengueStackX-19集成模型的整体结果最高,准确率从93.18%提高到96.38%,精确率从89.55%提高到94.20%,召回率从88.24%提高到94.20%,F1分数从88.89%提高到94.20%。这些一致的增益证明了该模型的鲁棒性以及一旦数据不规则性被消除后的有效泛化能力。
4.3. 模型鲁棒性评估的敏感性分析
敏感性分析评估了移除特定输入参数对模型性能的影响。基于SHAP和LIME分析,确定了MCH、总WBC计数、MCHC、MCV和RDW-CV等五个关键特征。每次消除一个特征以检查其对准确度、精确度、召回率和F1分数以及误差度量的影响。DengueStackX-19在所有特征移除测试中始终达到最高的整体性能,确认了其在实际临床决策中的适用性。
4.4. 混淆矩阵
混淆矩阵用于评估分类模型的性能。研究为分类模型创建并显示了混淆矩阵,直观展示了模型预测标签与实际标签的比较结果。
4.5. 受试者工作特征曲线
ROC曲线是用于评估二元分类模型性能的图形表示。它绘制了在不同阈值设置下的真阳性率对假阳性率。曲线越靠近左上角表示性能越好。研究为分类模型生成并可视化了ROC曲线。
4.6. 模型可解释性的可解释人工智能
4.6.1. 基于SHAP的模型解释
SHAP是一种增强模型可解释性的技术,解释了机器学习模型预测中每个特征的贡献。对DengueStackX-19使用SHAP来识别和可视化每个血液学参数对估计登革热风险的贡献,展示了其影响的程度和方向。研究使用了多种SHAP图,如瀑布图、力图、决策图和蜂群图,以提供全面的见解。
蜂群图显示,单核细胞、HCT、中性粒细胞、血小板计数、RBC和嗜酸性粒细胞是阳性类别的主要特征;较低的血小板聚集在右侧,将预测推向登革热,而较高的HCT、RBC和血红蛋白也将预测推向阳性。阴性类别则呈现相反的效果:较高的血小板将预测向左拉向阴性,其他血液学标志物的互补模式将模型的预测推离登革热。
瀑布图说明了个别决策,将单个预测分解为基线加上加性特征贡献。在阳性案例中,较低的嗜酸性粒细胞、MCH、性别、RBC、MPV推动预测向上,而年龄和血红蛋白提供了小的反向拉力。在阴性案例中,较高的中性粒细胞和单核细胞以及血小板计数将预测推向阴性类别,而较低的RBC仅提供轻微的反向效应。
决策图追踪特征如何累积地将预测从基线移动到最终输出。阳性案例显示SHAP决策路径从31.1%的基线上升到登革热的预测概率92.6%。较低的嗜酸性粒细胞、MCH、性别、RBC、MPV和PDW推动分数上升,而年龄和血红蛋白施加小的反向拉力。阴性案例显示分数从68.9%的基线移动到98.5%,由较低的中性粒细胞连同较高的单核细胞以及RDW-CV的额外支持所驱动,而较低的RBC和血小板计数提供轻微的反向效应。
力图说明了两个登革热案例的模型预测。样本165被正确分类为阳性,预测概率为97.5%。在考虑任何特征之前的模型输出基线值31.8%被红色特征(如RBC和单核细胞)向阳性类别移动,而蓝色特征(如淋巴细胞和MCHC)施加负面影响。样本102被正确分类为阴性,阳性概率仅为3.9%。68.2%的基线值被蓝色特征(如MCV和单核细胞)推向阴性类别,尽管一些红色特征(如嗜酸性粒细胞)推向阳性分类。
4.6.2. 基于LIME的模型解释
LIME是一种事后可解释性技术,旨在通过使用简单、可解释的模型局部近似任何机器学习模型的预测来解释其预测。它帮助识别哪些输入特征最强烈地支持或反对特定预测,在实例层面提供有价值的见解。研究中,LIME应用于DengueStackX-19模型的预测,以检查阳性和阴性登革热分类的特征贡献。
在阳性案例中,MCH、总WBC计数、MCHC、MCV和RDW-CV等特征被确定为预测登革热阳性的最有影响力的贡献者,这与显示感染患者显著血液学偏差的临床证据一致。然而,总血小板计数产生了小的负面影响,反映了登革热中典型的血小板下降。在阴性案例中,观察到相反的模式:MCH、MCV和RDW-CV的正常范围对登革热预测产生负面贡献,正确地将模型导向阴性分类。
这些基于LIME的见解通过确认模型的决策逻辑与现实世界的病理生理模式一致而提供了临床相关性。它们增强了透明度和信任,使医生能够理解、验证并自信地依赖AI的诊断建议。
4.7. 与现有研究的分析和比较
研究将提出的DengueStackX-19集成模型与登革热识别领域的现有研究进行了比较分析。比较突出了每个研究的关键方面,如数据集来源、模型名称、最佳性能模型、准确率和其他相关性能指标。结果表明,DengueStackX-19在准确率和可解释性方面均优于现有方法。
本研究通过将强大、可解释的AI模型转化为实用的基于Web的诊断工具,推动了登革热诊断的进步,该工具能够实现更快、更准确的决策。通过即时分析常规血液学数据,该系统在初级和资源有限的环境中支持早期病例识别,减少诊断延迟,指导及时干预,并最终改善患者预后。
DengueStackX-19模型是本工作的核心,这是一种基于集成学习的架构,完全基于来自1,523份患者记录的高质量临床血液学数据构建。通过严格的预处理、多样的不平衡处理策略和10折交叉验证,该模型始终提供强劲的结果,在SMOTEENN采样方法下达到96.38%的峰值分类准确率。该框架不仅实现了高预测准确率,而且在未见过的数据上评估时保持了强大的泛化能力。
为了促进其预测的信任和透明度,该研究集成了可解释的AI工具,如SHAP和LIME,这些工具不仅阐明了单个血液学特征对模型决策的贡献,而且使医疗保健专业人员能够做出可靠的、数据驱动的判断,从而增强早期和准确的诊断;由于这种可解释性增强了临床信心,它最终促进了改善的患者护理。此外,为了将研究转化为切实的临床实践,开发了一个基于Web的平台,使医疗从业者——无论是否能够使用专业实验室设施——能够进行快速和可访问的登革热检测,从而弥合了先进计算方法与现实世界医疗保健提供之间的差距。
尽管该框架显示出强大的预测准确性,但其适用性受到数据集缺乏多样性的限制;因此,未来的工作可以扩展跨区域和医疗设施的数据源以提高鲁棒性。整合实时临床数据并将血液学特征与患者生命体征相结合可以进一步提高预测性能,从而实现更准确、更及时的登革热诊断和管理。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号