
-
生物通官微
陪你抓住生命科技
跳动的脉搏
人工智能在临床风险预测中的应用:前景、表现及未来发展方向?
《BMJ Health & Care Informatics》:Artificial intelligence in clinical risk prediction: promise, performance and the path forward?
【字体: 大 中 小 】 时间:2025年12月11日 来源:BMJ Health & Care Informatics 4.4
编辑推荐:
人工智能在高血压检测与急诊风险预测中的应用及挑战
人工智能(AI)和机器学习正在重塑临床风险预测和患者监测方式。1 两项研究展示了这一变革,既凸显了其潜力,也指出了其中的挑战。Yoshihara等人研究了在日本初级保健环境中利用深度学习技术从咽部图像检测高血压的情况2,而Watson等人则评估了基于Transformer的模型在预测急诊患者病情恶化方面的效果,并将其与广泛使用的国家早期预警评分(NEWS)进行了比较。3 这些研究共同表明了AI在诊断能力上的扩展,记录了相比传统方法的改进,同时也揭示了其在临床广泛应用中面临的障碍。
Yoshihara等人针对高血压的漏诊问题进行了研究。高血压影响着全球超过十亿人,每年导致数百万人死亡。传统诊断依赖于血压测量设备,但在资源匮乏的环境中这些设备并不普及。2 他们的解决方案利用了高血压引起的咽部血管变化,开发出一种可以从咽部图像中检测高血压的深度学习算法。
研究结果令人印象深刻。他们基于7700多名患者训练的多实例卷积神经网络达到了0.922的接收者操作特征曲线下面积(AUROC),远超仅使用人口统计数据的模型(AUROC为0.887)。这种方法对于远程医疗来说具有重要意义,因为无接触、无需设备的诊断方式变得越来越重要。利用智能手机摄像头进行高血压筛查有可能使早期检测变得更加普及,尤其是在医疗基础设施有限的人群中。该研究通过Grad-CAM热图解决了深度学习的“黑箱”问题,这些热图可视化了模型对咽后壁(血管最明显的位置)的关注程度。类似的AI可解释性技术此前已在皮肤科领域得到应用,Grad-CAM提高了临床医生对AI驱动的黑色素瘤诊断的信任度。4 这进一步证明了可解释性AI模型在心血管领域的应用潜力;然而,其实际影响仍需进一步研究。
Watson等人研究了先进的机器学习模型是否能够改进对急诊科(ED)患者病情恶化的预测能力,相比NEWS而言。他们对超过174,000例急诊患者的回顾性研究测试了基于树的模型(LightGBM)和基于Transformer的模型(BioClinicalBERT),其中特别纳入了非结构化的文本分诊记录。3
研究结果非常显著。表现最佳的模型(结合扩展的表格数据和分诊记录的BioClinicalBERT)平均精确度达到了0.92,而NEWS的精确度仅为0.28(AUROC分别为0.96和0.66)。这表明,现代自然语言处理技术可以有效利用分诊记录中包含的宝贵临床直觉和上下文信息来优化风险分层。此外,基于Transformer的模型在不同人群中的偏见较NEWS更低,这对于实现公平的医疗护理至关重要。
这些发现与越来越多的文献一致,这些文献表明,尤其是那些利用丰富多模态数据源的机器学习模型,在各种环境和人群中始终优于传统的早期预警评分。基于梯度提升的机器学习模型和使用临床记录或传呼机信息的深度学习方法,其AUROC和敏感性均高于NEWS、改良的早期预警系统或Epic Deterioration Index等专有评分。关键在于,这些改进不仅体现在统计指标上,还体现在实际的临床结果上。更早、更准确地识别高风险患者能够及时进行干预并改善治疗结果。Yoshihara等人预测,高血压检测的敏感性可以提高10%,从而可能在全球范围内避免6000万例漏诊病例。2 同样,减少急性护理环境中的误报可以减轻医护人员的疲劳,同时提高患者安全和临床效率。
尽管取得了这些进展,但由于数据质量、患者群体和医疗系统的差异,仍存在重大挑战,尤其是在泛化能力方面。Yoshihara等人承认他们的研究对象具有种族和临床上的同质性,并使用了专用摄像头,这引发了关于模型适用范围更广的问题。然而,Watson等人的研究强调了需要在不同电子健康记录系统中进行验证,并警告不要过度依赖单一机构的训练数据。3
先进AI模型的复杂性也给实施带来了困难。尽管深度学习和Transformer模型性能优越,但它们的不可解释性可能会影响临床医生的信任并阻碍其应用。这两项研究都尝试通过可视化技术(如Grad-CAM热图和SHAP值)来解决这一问题,但跨不同临床环境的透明度和泛化能力仍是一个需要持续关注的挑战。提高信任度和可复现性的方法之一是通过研究论文公开透明化的方法论。另一种方法是遵循标准化报告指南,例如Yoshihara等人使用的TRIPOD(用于多变量预测模型的透明报告)或Watson等人使用的TRIPOD-AI(适用于报告基于AI的模型的更新版指南)。5
临床风险预测的未来不在于彻底取代传统工具,而在于深思熟虑的整合,充分利用所有可用的数据——无论是结构化的还是非结构化的,无论是客观的还是直观的。成功将取决于严格的验证流程、对偏见和公平性的系统关注,以及致力于增强而非替代临床专业知识的决心。该领域的首要任务包括确保医疗系统之间的互操作性、保护数据隐私以及保持适当的临床监督。随着医疗系统越来越多地采用AI驱动的工具,建立完善的治理框架和验证标准对于实现AI的潜力至关重要,同时确保患者安全。Yoshihara等人和Watson等人的研究2 3代表了这一进程中的重要进展,证明了当AI经过精心设计和严格评估时,确实能够显著提升临床风险预测能力。这些研究为未来的创新指明了方向,同时也强调了技术进步与临床实用性之间的平衡。
生物通微信公众号
知名企业招聘