机器学习助力新冠后综合征(PASC)风险预测:开启基层医疗新视野

【字体: 时间:2025年05月01日 来源:BMC Medicine 7.7

编辑推荐:

  新冠后综合征(PASC)诊断困难且病因不明。为解决此问题,研究人员开展了基于机器学习预测 PASC 风险的研究。结果显示,该模型能有效预测 PASC,还发现多种相关因素。这为 PASC 基层医疗诊断和病因探究提供了新途径。

  新冠疫情曾如风暴般席卷全球,给世界带来了巨大的冲击。在疫情逐渐缓和后,一个新的问题却悄然浮现 —— 新冠后综合征(Post-acute sequelae of COVID-19,PASC)。很多新冠感染者在康复后,却被一系列奇怪的症状所困扰,如长期疲劳、呼吸困难、嗅觉味觉障碍等。这些症状严重影响着患者的日常生活,使他们无法正常工作和生活,甚至还成为了常见的病假原因。
然而,目前 PASC 的诊断面临着诸多挑战。既没有客观的诊断测试,也缺乏可用的生物标志物,医生只能依据患者的器官功能障碍、各种症状及其持续时间来进行诊断。而且,PASC 的病理生理学机制也尚未完全阐明,这就如同在黑暗中摸索,让医生们难以精准地治疗患者。

为了攻克这些难题,来自瑞典的研究人员决心展开一项深入的研究。他们深知,找到有效的诊断工具和明确病因,对于改善 PASC 患者的治疗和预后至关重要。于是,他们将目光投向了机器学习技术,希望借助这一强大的工具,为 PASC 的研究带来新的突破。最终,他们的研究成果发表在了《BMC Medicine》杂志上。

研究人员开展了一项基于人群的病例对照研究,研究对象为瑞典斯德哥尔摩地区 18 - 65 岁在基层医疗中心(PHCCs)登记的人群。研究数据来源于 VAL 数据库,该数据库包含了丰富的信息,如基于国际疾病分类第十版(ICD - 10)的诊断信息和基于解剖治疗化学(ATC)代码的处方药物信息。

在研究中,研究人员使用了随机梯度提升(Stochastic Gradient Boosting,SGB)这一机器学习方法。这种方法非常适合分析高维数据,能够处理大量变量,并捕捉预测变量之间复杂的非线性相互作用。与传统的统计模型,如逻辑回归相比,SGB 在处理多变量和复杂数据时具有明显的优势,它可以更好地处理数据中的缺失值和共线性问题。

研究人员收集了患者在 PASC 诊断前一年的所有诊断信息、处方药物信息,以及是否因急性 COVID - 19 住院的信息。他们将这些数据进行整理和分析,通过一系列复杂的计算和模型训练,最终建立了用于预测 PASC 的 SGB 模型。

研究结果


  1. 预测能力:SGB 模型展现出了良好的预测准确性。对于女性,模型的受试者工作特征曲线下面积(AUC)达到了 0.804(95% 置信区间:0.789 - 0.819),这意味着在预测女性是否患有 PASC 时,有 80% 的预测是正确的;对于男性,AUC 为 0.839(0.820 - 0.858),预测准确率高达 84%。从混淆矩阵来看,在女性患者中,模型能准确识别出 6210 名未患 PASC 女性中的 5863 名,识别正确率为 95%;同时,能正确识别出 2993 名患 PASC 女性中的 1187 名,识别率为 40%。在男性患者中,模型正确识别出 3678 名未患 PASC 男性中的 3505 名,正确率为 95%;识别出 1398 名患 PASC 男性中的 678 名,识别率为 48%。
  2. 变量重要性:研究发现,不同性别中具有显著预测作用的变量存在差异。在女性中,有 17 个变量的标准化相对影响(NRI)≥1%,其中前五位的诊断包括因 COVID - 19 住院(NRI 为 41.7%)、不适和疲劳(14.5%)、病毒感染后及相关疲劳综合征(10.1%)、呼吸困难(8.4%)和上呼吸道感染(5.9%);排名靠前的药物有用于阻塞性气道疾病的肾上腺素能吸入剂等(2.8%)和全身性使用的激素避孕药(1.3%) 。在男性中,有 15 个变量的 NRI≥1%,前五位诊断为因 COVID - 19 住院(41.7%)、不适和疲劳(11.5%)、病毒感染后及相关疲劳综合征(6.4%)、呼吸困难(8.4%)和咳嗽(4.1%);主要药物为用于阻塞性气道疾病的肾上腺素能吸入剂等(1.5%)。
  3. 边际效应:性别分层统计模型结果显示,男女中 NRI 最高的前五个诊断的边际效应比值比(ORME)均大于 1。女性中,这些诊断包括嗅觉和味觉障碍(ORME为 28.9)、病毒感染后及相关疲劳综合征(21.1)、因 COVID - 19 住院(18.8)、呼吸困难(6.2)和个人其他疾病史(5.6)。男性中则为因 COVID - 19 住院(31.6)、病毒感染后及相关疲劳综合征(28.4)、不适和疲劳(7.9)、呼吸困难(6.5)和心动过速(5.2)。

研究结论与讨论


这项研究表明,SGB 模型能够有效识别 PASC 与诊断、用药之间的关联。验证了一些已知的风险因素,如先前因 COVID - 19 住院、呼吸和神经系统症状等与 PASC 的相关性。同时,还发现了一些新的预测因素,例如女性患者使用的激素药物与 PASC 的关联,这为进一步研究 PASC 的病因提供了新的方向。

不过,研究也存在一些局限性。比如基层医生可能未记录所有诊断,部分疾病可能存在漏诊情况;研究未区分住院患者的治疗强度;数据基于诊断和药物代码,无法评估一些潜在混杂因素等。但尽管如此,该研究仍具有重要意义。它为 PASC 在基层医疗中的诊断提供了新的方法和思路,有助于医生更好地识别高风险患者,合理分配医疗资源。而且随着更多数据的收集和研究的深入,该模型有望进一步优化和完善,为 PASC 的防治带来更多的希望。未来,还需要在更多人群中对该模型进行外部验证,并结合更多临床数据,如详细的住院信息、生物标志物等,来进一步明确 PASC 的发病机制和危险因素,从而为 PASC 患者提供更精准的治疗和管理。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号