深度学习在念珠菌血症早期诊断中的应用与挑战:基于大规模实验室特征数据的探索性研究

【字体: 时间:2025年06月24日 来源:Infectious Diseases and Therapy 4.7

编辑推荐:

  这篇研究探讨了深度学习模型在念珠菌血症(candidemia)与菌血症(bacteremia)早期鉴别诊断中的潜力。通过自动提取12,483例患者的29项实验室特征数据,研究发现深度学习模型在测试集中表现出中等判别能力(灵敏度0.70,特异度0.58,AUC 0.64)。值得注意的是,当结合特异性标志物血清β-d-葡聚糖(BDG)和降钙素原(PCT)时,模型性能未显著提升。该研究揭示了深度学习挖掘非特异性实验室数据复杂模式的潜力,同时强调了未来需结合临床特征开发更大规模模型的必要性。

  

研究背景与意义
念珠菌血症作为住院患者常见的血流感染(BSI),其病死率高达50%,尤其在发展为感染性休克时。早期诊断对改善预后至关重要,但现有临床评分和生物标志物如血清β-d-葡聚糖(BDG)与降钙素原(PCT)的敏感性和特异性仍有局限。AUTO-CAND项目通过自动化系统提取9年间15,752例BSI患者的实验室数据,为机器学习模型开发提供了大规模数据集。

研究方法与设计
研究分为三阶段:

  1. 数据准备阶段:验证实验室特征自动提取系统的准确性(>99%),最终纳入12,483例(10%念珠菌血症,90%菌血症)和29项实验室指标。
  2. 模型开发阶段:采用前馈神经网络(NN),包含输入层、3个隐藏层(100-50-25神经元)和输出层,使用优化真实技能统计量(TSS)的损失函数。数据按70%训练、15%验证、15%测试分割,保持10%的念珠菌血症比例。
  3. 特征选择与验证:通过交叉验证置换特征重要性(CVPFI)和相关性驱动置换特征重要性(CDPFI)筛选出7项关键指标(血小板计数、尿素、尿酸等),并在含BDG/PCT的亚组(n=1,165)中验证模型性能。

主要研究发现

  • 基础模型性能:在测试集中,NN模型灵敏度为0.70,特异度0.58,加权阳性预测值(wPPV)0.87,阴性预测值(NPV)0.95,AUC 0.64。
  • 特征重要性:血小板计数和尿素等常规指标对预测贡献显著,但SHAP分析显示其交互作用复杂,难以通过传统临床解读完全解释。
  • 联合标志物分析:在BDG/PCT可用亚组中,结合7项特征或迁移学习均未显著提升诊断性能(灵敏度0.68-0.71 vs. 单独BDG/PCT的0.70)。

讨论与展望
研究证实深度学习可挖掘非特异性实验室数据的潜在模式,但其判别能力仍低于临床预期。未来方向包括:

  1. 数据维度扩展:纳入动态指标变化趋势和临床特征(如中心静脉导管、肠外营养);
  2. 技术优化:探索时序模型(如LSTM)处理纵向数据;
  3. 多模态融合:结合自然语言处理(NLP)提取电子病历中的非结构化临床信息。

临床启示
尽管当前模型尚未超越传统标志物,其揭示的实验室指标交互作用为理解念珠菌血症病理机制提供了新视角。研究者强调,实验室数据驱动的AI模型应与临床特征模型互补,共同优化早期诊断策略。

局限性
回顾性设计、缺乏外部验证、未评估动态指标变化是主要局限。此外,模型解释性挑战(如SHAP分析的局部性)仍需方法学突破。

结论
这项大规模研究为AI在侵袭性真菌感染领域的应用奠定了数据基础,同时指明了结合临床-实验室多维度数据的发展路径。未来需通过前瞻性研究验证模型的泛化能力和临床转化价值。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号