综述:人工智能在识别和预测输血不良反应(ATRs)及临床管理意义中的应用:模型与应用的系统评价

《BMC Medical Informatics and Decision Making》:Artificial intelligence in the identification and prediction of adverse transfusion reactions(ATRs) and implications for clinical management: a systematic review of models and applications

【字体: 时间:2025年10月29日 来源:BMC Medical Informatics and Decision Making 3.8

编辑推荐:

  本综述系统评价了人工智能(AI)在识别、预测输血不良反应(ATRs)中的应用与临床管理潜力。文章指出,尽管AI模型(如随机森林、逻辑回归等)在预测输血风险、结局及分类ATRs方面展现出高潜力(AUROC最高达0.92),但研究存在重要空白:尚未有AI驱动的主动管理系统投入临床评估,且对儿科等脆弱人群关注不足。未来需推动AI与电子健康记录(EHR)整合,发展临床决策支持系统(CDSS),并重视伦理与隐私保护。

  
背景
尽管患者在安全方面取得了进步,但输血不良反应(ATRs)在临床环境中仍然时有发生,并且一直是医院血液预警委员会关注的主要焦点。ATRs是与输血血液及其成分相关的潜在风险,对其进行深入理解对于提升输血安全至关重要。ATRs通常分为感染性和非感染性两类,其中非感染性ATRs(NIATRs)更为普遍。ATRs可能引发严重并发症,如输血相关循环超负荷(TACO)、输血相关急性肺损伤(TRALI)、过敏反应和急性溶血反应等,给医疗系统带来显著的经济和临床负担。人工智能(AI)作为一种先进技术,已成为识别和减轻ATRs的有前景的工具。AI模型在分类和识别ATRs方面具有高能力,其表现可与输血医学专家相媲美。本系统评价旨在综合AI在识别和预测ATRs中的应用证据,并检验在主动临床管理中应用这些工具的可行性和有效性的现有证据。
方法
本系统评价严格遵循PRISMA 2020指南进行。检索了PubMed、Scopus和Web of Science数据库中近十年内发表的英文文献,重点关注AI在ATRs识别、预测及临床管理中的应用。研究质量使用QUADAS-AI工具进行评估,结果采用描述性方法呈现。由于研究设计、AI模型和结局指标存在异质性,未进行Meta分析。
初步检索获得1415项记录,去重后保留867项。经过标题、摘要和全文筛选,最终纳入24项研究进行综合分析。
纳入研究的国家分布显示,美国有16项研究,中国有4项,奥地利有2项,丹麦和日本各有1项。
质量评估结果
使用QUADAS-AI工具进行的质量评估显示,在偏倚风险方面,患者选择领域有2项研究存在高风险,指标测试领域有2项研究存在高风险,参考标准领域有1项研究存在高风险。在适用性关切方面,患者选择领域有4项研究存在高度关切,指标测试领域有5项研究存在高度关切,参考标准领域有3项研究存在高度关切。这提示部分研究的模型在真实世界临床环境中的适用性和结果的稳健性存在局限。
主要发现
AI模型分类与应用
纳入研究中使用的AI模型可分为四大类:
  1. 1.
    回归基础与统计模型:包括最小绝对收缩和选择算子(Lasso)回归、弹性网络回归(ENR)、逻辑回归、Cox风险比例模型等,共11项研究使用。
  2. 2.
    二元分类与树基础机器学习模型:包括随机森林(RF)、AdaBoost、极限梯度提升(XGBoost)等,共9项研究使用。其中RF模型使用频率最高(5项研究)。
  3. 3.
    深度学习与计算机视觉:包括卷积神经网络(CNN)和YOLO模型,用于ATRs识别和预测,共2项研究。
  4. 4.
    大语言模型(LLMs):包括聊天机器人和ChatGPT,用于分类和提取ATRs信息,共2项研究。
最常用的模型评估指标是AUROC(曲线下面积)和敏感性(各9项研究报告),其次是准确性和F1分数(各5项研究报告)。性能指标值波动较大,例如AUROC值介于0.71至0.92之间,敏感性介于0.63至0.977之间,这反映了模型性能对数据、架构和训练参数的依赖性。
临床应用焦点领域
AI模型主要应用于四个核心领域:
  1. 1.
    输血风险与结局:研究表明,血浆和血液制品输注本身可能导致严重并发症,如出血增加、感染、肾功能衰竭甚至死亡率升高。在移植患者中,输血与移植物排斥风险升高和生存率降低相关。这凸显了实施限制性策略和数据驱动的、AI辅助决策方法的必要性。
  2. 2.
    风险与调节因素:患者特异性因素,如凝血障碍史、术前血细胞比容水平或供受者状态,在输血相关并发症的发生中起决定性作用。例如,供受者性别匹配和生物标志物水平(如N末端脑钠肽前体,NT-proBNP)被证明是不良结局的重要预测因子。这表明输血决策不应仅依赖通用指南,而应根据个体患者情况和特定风险因素进行个性化定制。
  3. 3.
    输血量与强度:输血血液和血液制品的量已被确定为并发症(如儿科患者的高钾血症、死亡率增加或住院时间延长)的最关键预测因素之一。因此,精确监测输血量并应用智能工具确定安全阈值至关重要。
  4. 4.
    ATRs的分类与提取:像ChatGPT这样的AI模型展示了提取非结构化医疗数据和监测ATRs的能力。此外,CNN和YOLO等模型在分类单核细胞和不完全抗体反应强度方面表现出优于专家的性能。聊天机器人也为回应临床输血指南提供了实际支持。然而,使用AI生成的信息(如ChatGPT提供的信息)存在错误和响应可变性的担忧,需要谨慎对待。
临床科室与人群
研究涉及多个临床科室,其中血液学领域的研究最多(6项),其次是心脏科、外科和ICU(各3项)。从研究人群来看,绝大多数研究(16项)集中在成人群体,儿科人群仅涉及2项研究(血液学和新生儿护理),老年人群仅有1项研究(肾脏病学)。这表明研究存在对脆弱人群,特别是儿科患者关注不足的空白。
讨论与展望
研究比较与分析
不同研究中模型性能指标的广泛取值范围反映了模型性能波动及其对数据、架构和训练参数的依赖性。在二分类模型中,AUROC是常用评估指标,但在不平衡数据集中存在局限性。图像基础模型(如YOLO和CNN)在减少诊断时间和提高识别准确性方面显示出显著优势。然而,像聊天机器人这样的LLMs在提供准确信息方面存在不一致性,其安全性和可靠性仍需关注。研究表明,AI模型在分类和预测非感染性ATRs(NIATRs)方面具有高能力。
AI在ATRs管理中的应用与挑战
尽管AI模型在识别和预测ATRs方面显示出巨大潜力,但本综述未发现任何研究报告了基于AI的主动管理系统的开发、实施或临床评估。这凸显了模型开发与其临床实际应用之间的差距。临床决策支持系统(CDSS)可以在诊疗点(POC)部署以协助管理ATRs,但目前尚无完全自动化的、基于AI的CDSS用于ATRs主动管理的报道。
AI在临床应用中面临多重挑战,包括与现有电子健康记录(EHRs)集成困难、AI辅助决策中的责任归属问题、满足监管机构(如美国FDA、欧盟AI法案)的严格审批要求、实施和维护成本、以及模型中的潜在偏差等。技术层面,需要开发必要的基础设施,并利用HL7/FHIR等互操作性标准来协调输血相关数据集。模型可解释性(如使用SHAP、LIME等方法)对于建立用户信任和符合伦理部署至关重要。
优势与局限性
本综述的优势在于采用了严格的检索策略,使用QUADAS-AI工具进行质量评估,并全面考察了AI模型的多样性、数据类型和临床环境。其主要局限性包括无法获取部分文献全文、仅纳入英文文献、检索时间范围限制(近十年),以及最重要的,现有文献缺乏对AI基础主动管理系统实施或临床评估的研究。此外,QUADAS-AI评估揭示的部分研究的偏倚风险和适用性关切也影响了结果的稳健性。
结论
AI模型在预测输血风险和结局、识别风险因素、分析输血量关系以及分类提取ATRs方面展现出广泛应用。然而,在模型开发和其临床实际应用之间存在关键空白,尚未有AI基础的主动管理系统投入实践。未来研究应优先关注外部验证、临床影响试验、模型与EHRs的真实世界整合、成本效益分析,并遵循PROBAST、TRIPOD、CONSORT-AI等指南进行透明报告。个体患者因素和输血量在并发症发生中起关键作用,因此,实施安全的输血策略,包括使用与EHRs整合的CDSS和个性化医疗方法,至关重要。同时,必须严格遵守伦理考量并保护患者隐私。针对脆弱人群(尤其是儿科患者)的研究空白也亟待填补。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号