
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于机器学习的发热患者马尔尼菲篮状菌感染高特异性诊断模型:常规临床实验室数据的应用价值
【字体: 大 中 小 】 时间:2025年09月05日 来源:Frontiers in Microbiology 4.5
编辑推荐:
这篇研究通过机器学习(ML)算法整合发热患者的常规临床实验室数据(如血常规、生化指标及降钙素原PCT),构建了可高效筛查马尔尼菲篮状菌(Talaromyces marneffei, T. marneffei)感染的随机森林模型。该模型在临床验证中展现出0.989的AUC值和0.999的特异性,为HIV合并/非合并感染人群提供了早期预警工具,同时揭示了中性粒细胞、白蛋白等关键生物标志物的双峰分布特征。
引言
马尔尼菲篮状菌(T. marneffei)是一种温度双相性真菌,在哺乳动物体内可转化为分裂酵母形态。近年来,非HIV合并感染的病例比例逐年上升,其误诊率高达24%-51%,主要归因于发热等非特异性症状与结核病等疾病的相似性。传统血培养检测需7-14天且灵敏度仅76%,而骨髓培养或MP1抗原检测虽灵敏度达90%-100%,却依赖临床证据支持。机器学习技术在病原体感染诊断中展现出显著优势,但既往研究多局限于HIV分层或流行区域。
材料与方法
研究回顾性纳入2021-2025年浙江省多家医院的发热患者数据,通过稀疏偏最小二乘判别分析(sPLS-DA)从28项实验室指标中筛选特征。采用6种机器学习算法(包括随机森林、SVM等)进行1000次Bootstrap重采样建模,最终在独立临床验证集(n=1,953)中评估性能。
结果
训练集(n=485)中T. marneffei感染者(n=141)的UMAP聚类显示明确分界。sPLS-DA筛选出16项核心特征,包括年龄、单核细胞、中性粒细胞、甘油三酯(TG)和PCT等。随机森林模型表现最优:
OOB验证AUC达0.987,临床验证AUC 0.989
对T. marneffei的特异性0.999,敏感性0.692
真菌亚组分类AUC 0.962
讨论
模型创新性在于:
标志物发现:首次报道LDH、直接胆红素(DB)和TG的显著升高与T. marneffei感染相关,可能与肝细胞焦亡(pyroptosis)引发的IL-1β/IL-18释放有关。
临床适用性:覆盖HIV/非HIV混合人群,较既往研究(如Huang等AUC 0.815)显著提升性能。
局限性:训练集对血培养阳性样本的代表性不足,且未单独区分真菌/结核分枝杆菌感染。
结论
该模型通过常规实验室数据实现了T. marneffei感染的高效筛查,其标志物谱为后续多中心研究奠定基础。未来需扩大样本地域分布并优化细菌/真菌分类模块以提升普适性。
生物通微信公众号
知名企业招聘