综述:人工智能在出血性疾病预防与管理中的应用:一项系统性综述
【字体:
大
中
小
】
时间:2025年10月10日
来源:Frontiers in Medicine 3.0
编辑推荐:
本综述系统评估了人工智能(AI)在出血性疾病领域的应用进展,重点探讨了机器学习(ML)模型(如随机森林、XGBoost、LightGBM)在疾病诊断、风险分层(如抑制剂形成、靶关节预测)及个体化治疗(如预防方案优化)中的效能,并指出数据碎片化、模型可解释性及缺乏外部验证是当前临床转化的主要挑战。
出血性疾病是一组异质性的遗传性和获得性疾病,以止血功能受损为特征,导致过度或 prolonged 出血。止血是一个受到精密调控的过程,涉及血管收缩、血小板聚集形成临时栓子以及凝血级联反应的激活,最终形成纤维蛋白网以稳定血凝块。该过程中的任何环节出现紊乱——无论是血小板功能障碍、凝血因子缺乏、纤溶异常还是血管缺陷——都可能导致不受控制的出血、自发性出血甚至危及生命的并发症。
出血性疾病广泛分为血小板 disorders、凝血因子缺乏症和血管异常。血小板 disorders 如 Glanzmann Thrombasthenia、Bernard-Soulier 综合征和免疫性血小板减少性紫癜(ITP)损害了血小板的粘附、聚集或存活。凝血因子缺乏症包括血友病 A(因子 VIII 缺乏)、血友病 B(因子 IX 缺乏)和血管性血友病(VWD),后者影响血管性血友病因子(VWF)并损害血凝块形成。罕见的因子缺乏——包括纤维蛋白原、凝血酶原以及因子 V、VII、XI 和 XIII——也会导致异常出血。血管异常,如 Ehlers-Danlos 综合征和遗传性出血性毛细血管扩张症,会增加血管脆性和出血风险。
临床上,出血性疾病的表现谱广泛,取决于严重程度和受影响的通路。轻度病例可能表现为容易瘀伤、频繁鼻出血或轻微损伤后 prolonged 出血,而严重病例可能导致自发性关节(关节积血)或肌肉出血、胃肠道出血和颅内出血。 recurrent 出血,特别是关节积血,可导致关节损伤、残疾和生活质量下降。
尽管认识不断深入,出血性疾病的诊断和管理仍然充满挑战,在资源有限的环境中尤其如此。诊断依赖于临床病史、出血评估工具(BATs)和专门的实验室测试,包括血小板功能测定、凝血因子测量和基因检测。这些工具的可及性差异很大;在全球范围内,仅有 6.3% 的遗传性出血性疾病个体得到诊断,低收入和中等收入国家(LMICs)的诊断率低于 10%,而高收入国家(HICs)则为 55%。有限的实验室基础设施、高昂的检测费用和多变的症状表现导致诊断不足和误诊。
人工智能(AI)为这些挑战提供了有前景的解决方案。AI 包含机器学习(ML)和深度学习技术,能够分析复杂数据集以识别模式、进行预测并支持决策。在临床医学中,AI 已提高了诊断准确性、预测了结局并实现了个体化治疗。ML 算法,如随机森林和极限梯度提升(XGBoost),擅长检测高维数据中的非线性关系,使其适用于预测建模。在放射学、病理学和内窥镜检查等领域,AI 提高了诊断效率、减少了错误并优化了护理服务。
在出血性疾病中,AI 同样可以通过整合临床和实验室数据来改善诊断,通过 advanced 建模预测出血风险,并 individualize 治疗以优化结局。它还可能通过基因组和蛋白质组分析识别新的治疗靶点。然而,AI 在出血性疾病中的应用落后于其他领域,可能是由于疾病罕见、数据集碎片化以及有限的系统性评估。
本系统性综述遵循 PRISMA-2020 指南(系统综述和 meta 分析的首选报告项目),以在所有阶段(从文献检索到数据综合)保持 thorough 和一致的方法。研究框架以 PICOS 模型(人群、干预、比较、结局和研究设计)为指导,明确定义了纳入和排除标准以符合研究目标。
详细的检索策略旨在查找探讨人工智能(AI)在预防和管理出血性疾病中应用的相关研究。检索覆盖了主要数据库,包括 PubMed、Science Direct、Google Scholar 和 Wiley。结合了关键词和医学主题词(MeSH)术语,使用布尔运算符(AND/OR)以提高检索精度。查询包括术语如:(出血性疾病 OR 血友病 OR 血管性血友病 OR 凝血病 OR 凝血障碍 OR 血小板减少症 OR 止血障碍)AND(人工智能 OR AI OR ML OR 机器学习 OR 深度学习 OR 预测算法 OR 预测建模 OR 计算机辅助诊断)。检索于 2024 年 12 月 2 日完成,使用 Rayyan 软件管理引文以去除重复并促进初步筛选。
纳入标准使用 PICO 框架确保方法学严谨性。符合条件的研究聚焦于被诊断患有出血性疾病的人群,包括血友病、血管性血友病和其他凝血病。感兴趣的干预是人工智能(AI)技术的应用,例如机器学习、深度学习和预测算法,用于出血性疾病的诊断、预防和管理。研究要求包括与传统方法、常规护理或无 AI 干预的比较。综述优先报告与改善患者护理相关的结局,包括减少出血事件、加强出血事件管理、优化治疗剂量、早期预测和预防出血风险以及整体改善生活质量和医疗效率。仅考虑采用随机对照试验、观察性设计、横断面研究或队列研究的人类研究。
排除标准旨在保持对高质量、同行评审证据的关注。非同行评审文献,如社论、观点文章、会议报告或摘要,以及病例回顾、病例系列、综述文章和病例报告被排除。非英语撰写的研究和涉及动物模型的研究也被排除。应用这些标准以确保综述综合了关于 AI 在出血性疾病预防和管理中作用的 robust 和相关证据。
筛选过程系统进行,从审查文章标题开始,随后评估摘要。每个标题和摘要都根据预定义的纳入和排除标准仔细评估。在后续阶段,对全文文章进行详细审查,确保其涉及人工智能(AI)在出血性疾病诊断、预防或管理中的应用。特别关注那些提供足够科学细节关于 AI 技术、其应用及其对患者结局影响的研究。这种 rigorous 的三步筛选过程确保了纳入的研究能够为理解 AI 在改善出血性疾病诊断、预防和管理中的作用提供全面且相关的数据集。
使用结构化的 Microsoft Excel 表格从每项纳入的研究中系统提取数据,以确保全面准确地捕获关键信息。提取的数据包括研究设计、原产国和总样本量的详细信息,以及参与者特征,如性别、年龄和种族。记录了纳入和排除标准,包括症状、病史、诊断方法和其他相关因素。还记录了与模型开发相关的具体信息,包括使用的数据源、训练和测试过程以及模型性能指标,如准确性、精确度和敏感性。
提取的其他变量包括模型识别的关键预测因子、未诊断病例的数量以及这些未诊断病例的主要特征。仔细记录了研究局限性、结局定义、数据处理方法、探索性数据分析结果和验证策略。还收集了给予患者的治疗细节。这种结构化和系统化的数据提取方法确保了包含所有必要变量,以全面评估人工智能(AI)在出血性疾病诊断、预防和管理中的作用。
为了评估纳入研究的偏倚风险,我们使用了各种经过验证的工具,每种工具专为不同的研究类型设计,以确保 thorough 和一致的评估。
对于观察性研究,使用了非随机研究中的偏倚风险 - 暴露(ROBINS-E)工具。该工具评估多个领域的偏倚,包括混杂、参与者选择、暴露分类、与预期暴露的偏离、缺失数据、结局测量和报告选择。使用这些标准审查每项观察性研究,从而能够详细评估非随机研究特有的潜在偏倚。领域被评为低风险(L)、中度风险(M)、严重风险(S)、极严重风险(C)或无信息(NI)。
本综述中纳入的随机对照试验(RCT)的偏倚风险评估使用 Cochrane 偏倚风险 2(RoB 2)工具进行,这是一个 rigorous 且广泛接受的评估 RCT 方法学质量的框架。评估侧重于五个关键领域:随机化过程产生的偏倚、由于偏离预期干预措施导致的偏倚、由于缺失结局数据导致的偏倚、结局测量中的偏倚以及报告结果选择中的偏倚。每个领域都经过系统评估,根据预定标准,研究被评为低偏倚风险、有一些担忧或高偏倚风险。
由于纳入研究之间存在 substantial 异质性,未进行定量 meta 分析。变异性存在于 AI 模型架构(如随机森林、XGBoost、图神经网络)、预测变量(遗传、临床、实验室、环境)、结局定义(例如,短期出血风险、抑制剂 development、疾病严重程度分类)和性能指标(准确性、AUROC、F1-score、PPV)。这种异质性排除了有效的统计汇总,因此采用了叙述性综合方法。
筛选已识别研究的初始阶段涉及审查其标题和摘要,以根据本系统综述定义的 PICOS 标准评估相关性。检索得到 2,927 条记录,导入 Rayyan 软件以简化和组织筛选过程。Rayyan 自动识别并移除了 161 个重复条目,剩下 2,766 个独特记录供评估。
筛选的第一阶段侧重于根据预先确定的纳入和排除标准评估标题和摘要。结果排除了 2,714 项不符合综述核心焦点(即 AI 在出血性疾病预防和管理中的应用)的研究。在下一阶段,对剩余的 52 篇摘要进行了更深入的审查。此阶段涉及检查每项研究与 AI 在出血性疾病风险预测、诊断进展和治疗优化中应用的相关性。排除了未直接涉及这些主题的研究,剩下 21 篇文章进行全文评估。
最后阶段涉及仔细的全文评估,以确保符合纳入标准。由于关注点不足或缺乏相关数据,排除了 9 项研究,最终共有 12 项研究纳入系统综述。这种 rigorous 的选择过程为理解 AI 在出血性疾病管理中的应用奠定了可靠的基础。
纳入研究的偏倚风险评估分两个阶段进行:分别针对非随机研究和随机对照研究。
使用 ROBINS-E 工具进行的研究偏倚风险评估,该工具基于七个领域评估非随机研究的质量:因混杂导致的偏倚风险、暴露测量引起的偏倚、参与者选择中的偏倚、暴露后干预导致的偏倚、缺失数据导致的偏倚、结局测量引起的偏倚以及报告结果选择中的偏倚。
在因混杂导致的偏倚风险领域,大多数纳入研究被评为具有中度风险,可能是由于对混杂因素的调整不完整或控制策略报告不明确。然而,如 Ferreira 等人和 Sidonio Jr 等人的研究获得了低风险评级,表明进行了更 rigorous 的混杂控制。
对于暴露测量引起的偏倚,大多数研究表明低风险,表明评估方法可靠。然而,在一些研究中注意到中度担忧,可能是由于测量不准确或暴露定义不明确。参与者选择中的偏倚风险领域通常为低风险,除了 Aleksi? 等人的研究被评为中度风险,可能是由于来自单一中心的小样本量可能引入偏倚。
在缺失结局数据导致的偏倚领域,在几项研究中观察到中度风险,通常是由于随访不完整或报告策略不足。值得注意的是,Hu 等人被评为高风险,而像 An 等人和 Sidonio Jr 等人的研究则表现出低风险,表明强大的数据管理实践。
对于结局测量引起的偏倚,大多数研究被归类为低风险,而像 Hu 等人、Lopes 等人、Ferreira 等人和 Rawal 等人的研究获得了中度风险评级,表明结局测量可能存在不一致。最后,在报告结果选择偏倚中,Rawal 等人、Hu 等人、Singh 等人、Sidonio Jr 等人和 Aleksi? 等人被评为中度风险,表明可能存在选择性报告,可能夸大发现或省略关键结局。该分析强调了各研究存在的不同程度偏倚,强调需要谨慎解释,特别是对于那些具有高总体风险评级的研究。
本综述中纳入的随机对照试验(RCT)的偏倚风险评估使用 Cochrane 偏倚风险 2(RoB 2)工具进行,该工具评估 RCT 在五个关键领域的质量:随机化过程产生的偏倚、由于偏离预期干预措施导致的偏倚、由于缺失结局数据导致的偏倚、结局测量中的偏倚以及报告结果选择中的偏倚。
该研究表现出中度的总体偏倚风险。虽然各组基线特征具有可比性,但随机化过程和分配隐藏未明确详细说明,引入了潜在偏倚。该试验的开放标签设计进一步导致了 performance 偏倚,因为参与者和人员均未设盲;然而,主要结局年化出血率(ABR)的客观性质减轻了这一点。缺失的结局数据通过在校准可用的随访期间内的出血计数进行处理,降低了 attrition 偏倚的风险。结局测量是客观的,并且不太可能受到评估者的影响,考虑到所收集数据的性质。最后,该研究似乎报告了所有预定的结局,没有选择性报告的证据。尽管有这些优势,但缺乏盲法以及随机化细节不足导致总体偏倚风险为中度。
本系统综述涵盖了 12 项研究人工智能(AI)在出血性疾病中应用的研究。这些研究采用了多种方法学,包括回顾性和前瞻性队列研究、随机对照试验和可行性研究。研究在包括美国、英国、西班牙、德国、巴西、日本、塞尔维亚、印度和中国在内的地理多样化环境中进行,为 AI 在出血性疾病管理中的作用提供了全球性的理解。观察期差异很大,回顾性研究分析了多年的电子健康记录(EHR)数据,而前瞻性试验则评估了数月内的 AI 干预。
所综述的研究包括了具有不同人口统计学和临床特征的多样化人群,反映了出血性疾病的异质性。样本量范围很广,从 96 名参与者的小型队列到超过 23,000 人的广泛队列。年龄分布在各研究间差异显著,一些研究侧重于儿科人群,而另一些则针对老年人。性别代表性通常受到所研究疾病的影响。专注于血友病 A 的研究主要包括男性,考虑到该病的 X 连锁遗传。例如,Chowdary 等人的研究完全由男性组成,而关于血管性血友病(VWD)和 ITP 的研究则包括更平衡的性别分布,例如 Miah 等人报告 ITP 患者中 53% 为男性,47% 为女性。
一些研究考虑了种族多样性,特别是在美国等多民族环境中进行的研究。例如,Hu 等人分析了来自 ATHN 数据集的数据,捕获了西班牙裔和非西班牙裔人群,而像 Rawal 等人的研究则包括了白人、黑人和亚洲参与者等种族类别。
这些研究采用了多种机器学习算法,反映了出血性疾病的复杂性及其多样化的数据集。监督学习模型是最常用的,包括随机森林、XGBoost、梯度提升机(Gradient Boosting Machines)、CatBoost 和支持向量机(SVM)。这些算法在预测和分类任务中表现出色,例如预测出血风险、识别高风险突变和优化预防性治疗方案。逻辑回归模型也在几项研究中得到应用,特别是在数据集预测变量较少或专注于明确定义的临床结局时。与上述研究相反,Sidonio Jr 等人进行的研究使用了一种基于正未标记学习(positive-unlabeled learning)的一元预测模型,该模型使用一组 12 个关键预测变量,将确诊患者群体的特征与潜在未确诊人群的特征进行比较。
所综述的研究采用了各种策略来开发和 refine 用于出血性疾病预测的机器学习模型。一种常见的方法是将数据集分割为训练和测试子集,通常采用 80:20 或 75:25 的比例,如 Rawal 等人所示。几项研究采用了交叉验证技术以增强模型稳健性。例如,Chowdary 等人应用了重复嵌套交叉验证,确保模型在数据的不同子集上训练,防止过拟合。类似地,An 等人使用包含 1,097 名患者的独立前瞻性队列进行外部验证以测试普适性。Aleksic 等人由于样本量小(96 名患者)而调整了其验证策略,选择了适合其数据集的训练集方法。
模型优化在提高预测性能方面发挥了关键作用。应用了各种技术,包括超参数调优、特征选择和数据平衡。几项研究采用网格搜索来微调超参数。例如,Hu 等人使用网格搜索优化 CatBoost 和随机森林模型以最大化准确性和召回率。类似地,Rawal 等人利用超参数调优优化 LightGBM,该模型最终以 ~0.99 的 F1 分数优于其他模型。F1 分数是衡量模型在精确度和召回率之间平衡的指标,使其特别适用于必须最小化假阳性和假阴性的不平衡数据集。
为了解决类别不平衡和增强普适性,一些研究实施了数据平衡技术。Lopes 等人使用 ADASYN(自适应合成采样)来创建更均匀分布的数据集,防止对 overrepresented 类别的偏倚。此外,Singh 等人探索了不同的编码方法,例如 One-Hot 编码(OHE)和位置特异性突变(PSM)编码,发现 PSM 提高了对血友病 A 突变的分类准确性。
特征选择是另一个关键的优化策略。An 等人应用 Lasso 回归来移除冗余特征,同时保留最显著的预测变量,从而提高了模型性能。
一些模型结合了遗传、分子和环境数据以及临床变量来改进预测。例如,图神经网络、位置特异性突变编码和 LightGBM 被应用于预测疾病严重程度、突变效应或抑制剂发展。环境和社会人口学因素,如毒素暴露、吸烟、饮食和合并症,也被整合到几个模型中以增强风险评估。
通过 rigorous 的验证技术(如嵌套交叉验证、分层 k 折交叉验证和外部验证数据集)加强了模型评估。性能指标包括准确性、精确度、召回率、F1 分数和 AUROC(受试者工作特征曲线下面积)。例如,Chowdary 等人报告其表现最佳的随机森林模型的 AUROC 为 0.785。AUROC 衡量模型区分阳性病例和阴性病例的能力,值越高表明判别性能越好。然而,应谨慎解释这些性能指标。回顾性设计、小样本量和缺乏外部验证增加了过拟合和人为夸大 AUROC 值的风险。发表偏倚——偏向阳性结果——也可能夸大这些模型的临床效用。
人工智能(AI)已成为出血性疾病研究中有价值的工具,促进风险分层、早期诊断和治疗优化。机器学习模型已应用于各种出血性疾病,包括血友病、血管性血友病(VWD)、免疫性血小板减少症(ITP)和肝硬化相关静脉曲张出血,以识别增强临床决策的预测模式。
机器学习在血友病中的应用侧重于预测疾病严重程度、抑制剂发展和优化预防。Singh 等人将随机森林和 SVM 模型应用于突变数据,证明因子 VIII 基因保守区域中的特定错义突变与疾病严重程度 strongly 相关。Rawal 等人使用 LightGBM 整合遗传和免疫学特征来预测抑制剂发展,实现了 ~0.99 的 F1 分数,表明性能高度平衡。Ferreira 等人采用图神经网络分析突变严重性,基于分子和结构数据实现了高达 70% 的准确性。Lopes 等人使用决策树、随机森林和 XGBoost 模型检查了 FVIII 蛋白中的非同义点突变,并针对体外数据和临床报告验证了预测。
关键预测因子包括基线因子 VIII 活性、F8 突变类型、累计出血次数和蛋白质结构相互作用。特征选择方法如 SHAP 和 Lasso 回归通过移除不太相关的变量提高了模型性能。Hu 等人分析了超过 23,000 名血友病个体的数据集,使用 AI 模型根据出血事件频率和抑制剂发展风险检测未确诊病例。Rawal 等人应用机器学习预测抑制剂阴性血友病 A 状态,使用生物学相关变量(如 F8 突变类型和肽-HLA 结合亲和力)以高精确度识别未诊断的突变。
机器学习模型改善了 VWD 的早期检测和分类。Sidonio Jr. 等人开发了一个使用随机森林和梯度提升机的模型来检测血管性血友病(VWD),识别了 48,902 例未确诊病例,包括 28,463 名女性和 20,439 名男性。该模型利用出血模式、医疗资源利用和人口统计学特征等特征来识别 VWD 的细微指标,实现了高准确性(男性 85%,女性 84%)。女性月经过多(HMB)和男性鼻出血被确定为关键预测因子。类似地,Sidonio Jr. 等人利用正未标记学习方法检测未诊断的 VWD 病例,其模型在最佳拟合组中实现了 83% 的阳性预测值(PPV),在良好拟合组中实现了 75% 的 PPV,突出了关键预测因子,如出血相关手术次数和总出血索赔数。
Chowdary 等人进行的研究使用 SHAP(Shapley Additive Explanations)值来识别最关键的预测因子,如血管性血友病因子水平和累计出血次数,消除了不太相关的变量。
机器学习方法将 ITP 与其他血小板减少症区分开来并预测临床结局。Miah 等人使用人口统计学和血液学参数开发模型,选择随机森林因其 superior 准确性(100%)。An 等人整合了变量如感染状态、心血管疾病、血小板趋势、糖尿病和疾病持续时间来评估出血风险。
关键预测因子包括血小板计数、绝对淋巴细胞计数、心血管合并症和疾病持续时间。ML 模型还通过分析电子病历以及实验室和临床数据趋势,能够识别未确诊或有风险的 ITP 患者。
机器学习分类器基于临床、生化和内镜参数预测静脉曲张出血风险。Aleksic 等人确定脾脏直径、血小板计数和存在大的食管静脉曲张为最强预测因子。环境因素如毒素暴露和疾病进展也影响出血风险。预测模型应用于纵向数据,跟踪饮食摄入、预防依从性和毒素暴露,为高风险患者提供早期预警。
跨出血性疾病,关键预测因子 consistently 包括:
? 遗传因素:F8 突变、保守错义突变、非同义点突变
? 实验室生物标志物:因子 VIII 活性、血小板计数、中性粒细胞和淋巴细胞水平
? 临床病史:累计出血次数、手术、合并症、疾病持续时间
? 人口统计学因素:年龄、性别、社会人口学/环境暴露
将这些预测因子整合到 ML 算法中增强了疾病分类、早期诊断和个体化治疗策略。
本系统综述强调了机器学习(ML)在预测和管理出血性疾病应用方面的进展。对各研究中表现最佳模型的比较为了解其预测性能、优势和局限性提供了宝贵见解。
在各研究中,随机森林、XGBoost 和 LightGBM consistently 表现出强大的预测性能和可解释性。对于免疫性血小板减少症(ITP),随机森林实现了高准确性,特别是在区分 ITP 与其他血小板减少病症方面。在血友病 A 预测中,LightGBM 和随机森林最有效,LightGBM 实现了 ~0.99 的 F1 分数。梯度提升机和随机森林在血管性血友病(VWD)分类中也表现良好,以高准确性识别未确诊病例。对于肝硬化相关静脉曲张出血,LogitBoost 被证明高度准确,而广泛的人群水平分析则倾向于使用随机森林和 CatBoost 来预测血友病患者的靶关节。
集成学习模型的成功突显了它们处理复杂、多维数据集的能力。SHAP 值和 Lasso 回归等技术提高了可解释性,而超参数调优则增强了预测性能。然而,文献中明显存在几个局限性。常见问题包括类别不平衡、缺失数据和混杂,所有这些都可能影响报告的结局。外部验证有限,限制了普适性。深度学习模型虽然前景广阔,但仅表现出中等准确性,并且由于其“黑箱”性质,在临床上仍然难以实施。解决这些局限性将需要提高数据集质量、更广泛的外部验证以及开发适合真实世界环境的可解释模型。
AI 模型预测的结局也有很大差异。短期预测包括数周内的 critical 出血(An 等人)和 12 周内的治疗反应(Chowdary 等人)。长期预测包括抑制剂发展、靶关节形成和严重程度分类。这个范围表明一些模型更适合急性决策,而其他模型则为纵向管理提供信息。大多数研究依赖于基线预测因子——人口统计学、遗传学或初始实验室值——而只有少数纳入了时间变化变量,如系列血小板计数、不断演变的合并症或治疗依从性。纳入纵向数据可以 substantially 增强临床相关性。
尽管 meta 分析可以汇总诊断准确性估计值,但模型架构、预测变量、结局和指标的异质性使得统计合成不合适。相反,标准化报告 AUROC、PPV、校准和一致的结局定义对于未来的 meta 分析至关重要。重要的是,几项研究被评为中度至高度偏倚风险——特别是由于缺失结局数据、对混杂因素调整不足或选择性报告——可能夸大了报告的准确性。相反,来自低风险研究(Sidonio Jr 等人)的发现更可能反映真实的临床性能。总体而言,虽然结果令人鼓舞,但对具有 rigorous 方法学和外部验证的模型信心更强。
尽管技术结果令人鼓舞,但采用仍然缓慢。挑战包括碎片化的数据集、跨 IT 系统的互操作性差、监管障碍、临床医生熟悉度有限以及对透明度的担忧。 access 不平等持续存在,特别是在资源匮乏的环境中。解决这些障碍需要协调努力——多中心注册、将可解释的 AI 集成到 EHR 中以及临床医生培训。
异质性在疾病和研究设计中都很明显。在血友病中,遗传和结构特征占主导地位;在 VWD 中,医疗资源利用和出血模式是关键;在 ITP 中,血小板计数和合并症至关重要;在肝硬化中,临床和内镜数据是核心。共享的预测因子,如血小板计数和因子 VIII 活性,在不同疾病中出现。然而,大多数模型是在高收入国家开发的,限制了在诊断差距最大的低资源环境中的见解。未来的工作应在这些环境中测试普适性。
机器学习方法在出血性疾病的早期诊断、风险分层和治疗优化方面显示出 promise。识别未确诊病例——特别是在 VWD 和血友病中——突出了改善结局的潜力。然而,大多数研究仍局限于回顾性设计和内部验证。需要前瞻性验证、AI 辅助决策的随机对照试验以及成本效益分析来指导真实世界的采用。
实施应强调具有直接临床意义的指标。例如,PPV 反映了正确阳性预测的比例,在出血性疾病中至关重要,因为假阳性可能导致不必要的因子替代、侵入性 procedures 或 prolonged 监测。Sidonio Jr 等人报告的 PPV 为 75%–83%,这令人鼓舞,但对于常规实践来说仍然不足。
实际集成需要将工具嵌入临床工作流程。例子包括 ITP 中基于 EHR 的风险警报或血友病预防中的剂量支持。障碍包括互操作性、信任、监管和成本。解决方案可能涉及用于数据隐私的联邦学习、为临床医生提供的决策支持仪表板以及结构化培训。
未来的研究应优先考虑前瞻性、多中心验证、基于注册的自适应试验以及纵向和环境数据的整合。可穿戴设备和远程监测可以实现个体化的实时管理。在政策层面,监管机构必须为 AI 在罕见血液病中的采用建立框架,在确保安全的同时鼓励创新。
机器学习已成为出血性疾病预测和管理中的变革性工具,实现早期诊断和个体化治疗。集成模型如随机森林、XGBoost 和 LightGBM 展示了强大的预测能力,但必须解决数据不平衡和有限的外部验证等挑战,以实现更广泛的临床采用。
未来的研究应侧重于真实世界验证、电子健康记录集成和可解释的 AI 方法学。通过 refine ML 模型并确保其在临床工作流程中的可及性,这些进步可以加强出血性疾病管理,最终改善患者结局和生活质量。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号