人工智能在癫痫患者诊疗历程中的磁共振成像应用:四项临床应用的荟萃分析

《Epilepsia》:Use of artificial intelligence in magnetic resonance imaging across the epileptic patient's journey: A meta-analysis of four clinical applications

【字体: 时间:2026年06月09日 来源:Epilepsia 6.6

编辑推荐:

  目的:人工智能/机器学习(artificial intelligence/machine learning, AI/ML)在磁共振成像(magnetic resonance imaging, MRI)中的应用有望增强和支持癫痫的临床决策。然而,目前缺乏对当前旨

  
目的:人工智能/机器学习(artificial intelligence/machine learning, AI/ML)在磁共振成像(magnetic resonance imaging, MRI)中的应用有望增强和支持癫痫的临床决策。然而,目前缺乏对当前旨在支持癫痫临床检查中决策的AI/ML驱动模型的临床效用和研究严谨性的适当评估。方法:研究人员系统回顾并检验了当前基于MRI的AI/ML驱动模型在癫痫临床检查中四项主要应用的能力:(1)诊断,(2)颞叶癫痫(temporal lobe epilepsy, TLE)侧化,(3)病灶(局灶性皮质发育不良,focal cortical dysplasia, FCD)定位,以及(4)术后预后预测。研究人员还评估了每个研究模型的偏倚风险。采用基于任何MRI模态或序列类型训练的AI/ML分类模型的研究被纳入定性评估;随后那些报告准确率的研究被纳入荟萃分析(meta-analysis)。结果:在3227篇搜索到的文章中,研究人员确定了159项研究(n=26732名参与者)进行定性评估,127项研究(n=20456名参与者)纳入荟萃分析。研究结果显示,基于MRI的AI/ML能够准确区分癫痫患者与健康对照(总准确率=0.87,95%置信区间[confidence interval, CI]=0.85–0.89),侧化TLE(0.90,95% CI=0.87–0.93),定位致痫病灶(0.82,95% CI=0.74–0.87),以及预测术后无发作(0.83,95% CI=0.78–0.87)。然而,系统性评估表明文献中存在非常高的偏倚风险,提示性能估计过于乐观。意义:尽管研究结果支持AI/ML模型在癫痫诊断和预后方面总体具有高准确率,但文献仍然容易受到参与者招募和验证方法偏倚的影响。此外,大多数模型受到研究架构的限制,要求严格遵守非标准化、高度特异的数据采集和处理方案,难以轻易部署到临床实施。研究人员鼓励临床和科学团体之间更紧密的跨学科合作以改进验证研究,并概述了对未来研究设计、分析和报告的建议。
**论文解读:人工智能在癫痫患者MRI中的临床应用——四项指标的荟萃分析**

**研究背景、问题与目的**

癫痫是一种常见的慢性神经系统疾病,全球超过6000万人患病,其中约三分之一的患者无法通过药物治疗实现无发作。手术是药物难治性癫痫的有效治疗手段,但平均从首次发作到手术需等待20年,且术后仍有30%–40%的患者存在发作。磁共振成像(magnetic resonance imaging, MRI)在评估药物难治性癫痫中至关重要,可检测致痫病灶。然而,精确侧化颞叶癫痫(temporal lobe epilepsy, TLE)及定位局灶性皮质发育不良(focal cortical dysplasia, FCD)等病灶仍具挑战性。人工智能/机器学习(artificial intelligence/machine learning, AI/ML)应用于MRI有望提高诊断与预后判断能力,但当前模型在算法、MRI序列和患者队列上高度异质,缺乏对其临床效用和研究严谨性的系统评估。因此,本研究旨在(1)评估AI/ML模型在癫痫诊断、TLE侧化、病灶(尤其是FCD)定位及术后预后预测四项临床应用中的性能;(2)通过偏倚风险评估审视研究严谨性。

**研究内容、结论与意义**

研究人员开展了系统性回顾和荟萃分析,检索至2025年1月1日的文献,最终纳入159项研究(共26732名参与者)进行定性评价,127项研究(共20456名参与者)纳入定量荟萃分析。结果显示,AI/ML在MRI上的总体准确率在诊断、侧化、定位和术后预后预测中分别达到0.87、0.90、0.83和0.82(所有95%置信区间均显示较高区分度)。然而,基于预测模型偏倚风险评估工具(Prediction Model Risk of Bias Assessment Tool, PROBAST)的系统评估揭示,所有研究均存在高偏倚风险,主要源于参与者招募、预测因子、结果判断和统计分析等方面的不足,导致性能估计可能过于乐观。该研究的意义在于:首次全面整合并批判性评价了AI/ML在癫痫MRI中的文献,既肯定了其高准确率的潜力,又指出了阻碍临床转化的关键偏倚来源,为未来研究设计、分析与报告提供了具体建议。论文发表在《Epilepsia》。

**关键技术方法(不超过250字)**

研究人员依据PRISMA(Preferred Reporting Items for Systematic Reviews and Meta-Analyses)指南和PROSPERO(Prospective Register of Systematic Reviews,注册号CRD42023474405)进行系统综述。检索Ovid MEDLINE/PubMed、Embase和Google Scholar数据库。由两位独立评审者筛选标题/摘要和全文,分歧通过讨论或咨询第三位评审者解决。数据提取和偏倚风险评估(使用PROBAST)由四名评审者独立完成。荟萃分析主要度量指标为分类准确率,采用广义线性混合效应模型(generalized linear mixed-effects model)合并经logit转换的比率数据,并用Cochran Q和I2检验异质性。通过元回归分析评估MRI模态、分类方法、发表年份和队列规模对合并估计值的调节作用,并采用Egger检验和剪补法评估发表偏倚。样本队列来源:来自全球多中心,最终纳入159项研究(n=26732)进行定性分析,127项(n=20456)进行定量分析。

**研究结果**

**3.1.1 诊断癫痫**
基于多项研究(共84个准确率报告)的荟萃分析显示,AI/ML模型区分癫痫患者与健康对照(含少数其他疾病对照)的合并准确率为0.87(95% CI=0.85–0.89,n=5621名患者/11410总样本)。最常用的算法为支持向量机(support vector machine, SVM),最常用MRI模态为多模态,其次为T1加权(T1-weighted, T1w)序列。

**3.1.2 侧化TLE**
33项研究报告了38个准确率,合并准确率为0.90(95% CI=0.87–0.93,n=1071名患者/2396总样本)。常用算法为SVM和判别分析(discriminant analysis, DA),MRI序列以T1w为主。

**3.1.3 定位局灶性癫痫病灶**
26项研究报告了31个准确率,合并准确率为0.83(95% CI=0.74–0.87,n=1032名患者/1351总样本)。其中7项研究仅针对FCD患者。所有精确率基于受试者水平(即二元正确检测病灶与否)。多数研究采用神经网络(neural network, NN)框架和多模态MRI(T1w和液体衰减反转恢复[fluid-attenuated inversion recovery, FLAIR]序列组合)。

**3.1.4 预测术后预后**
19项研究预测术后无发作(Engel分级),合并准确率为0.82(95% CI=0.78–0.87,n=1410名患者/1820总样本)。多数研究纳入TLE患者,主要算法为SVM和DA,常见MRI序列为T1w和弥散成像(diffusion)。

**调节变量与亚组分析**
元回归显示,发表年份显著调节合并准确率,但仅解释0.8%的异质性。队列规模与诊断和术后预后预测的准确率呈负相关(r=?0.45及?0.51,p<0.01)。MRI模态解释16.5%方差,但多模态与单模态无显著差异。算法类型解释69%方差,但各算法间差异不显著。亚组分析(成人/儿童、药物难治性、MRI阴性/阳性、场强1.5T/3T)显示结果与总体一致。

**发表偏倚**
漏斗图不对称,Egger检验显著,经剪补法校正后诊断、侧化、定位和术后预后预测的合并准确率分别降至0.85、0.87、0.78和0.82。

**偏倚风险评估**
所有研究在PROBAST四领域(参与者、预测因子、结局、分析)中总体被评为高偏倚。参与者偏倚在诊断研究中占87%,侧化64%,定位88%,术后预后69%。预测因子偏倚在所有定位和侧化研究中为高;分析偏倚在诊断研究中100%为高。术后预后研究的结局偏倚较低(0%),但诊断、定位和侧化研究的结局偏倚均较高。主要原因包括回顾性数据募集、样本量小(<100)、缺乏独立验证集等。

**总结讨论**
讨论部分指出,尽管AI/ML模型在MRI上显示出高准确率,但样本量、MRI模态和算法类型均影响性能,且样本量小易致过拟合和偏倚。MRI模态比算法更重要,但多模态未显著优于单模态。高异质性主要由建模策略差异驱动。PROBAST识别的关键偏倚来源包括:回顾性使用诊断MRI数据作为金标准,导致预测因子与结局部分重叠;单中心小样本限制通用性;缺乏对年龄、性别等协变量的校正;未使用独立外部验证。此外,模型对MRI序列和处理步骤的高度特异性限制了临床推广。未来研究应注重前瞻性设计、扩大代表性队列、提高数据标准化、与临床工作流整合,并报告更全面的性能指标(如Dice相似系数、AUROC等)。

**研究结论(翻译自原文讨论最后一段)**
AI/ML在癫痫中的临床应用已展现出令人瞩目的进展,未来减轻剩余偏倚来源的工作将有助于将模型临床整合以直接支持患者。鉴于当前临床指南并不单独使用MRI进行决策,而是结合其他诊断工具(如症状学、脑电图、正电子发射断层扫描)综合判读,将AI/ML模型应用于MRI并与这些其他模态整合也可作为本领域的未来研究方向。然而,未来研究必须优先考虑稳健的研究设计,并通过强调临床整合的易用性、可解释性和外部验证来迈向临床整合。研究人员鼓励在医疗系统内部以及护理中心与研究团体之间开展更紧密的合作以扩大患者招募,并强调需要包容性、大型、多中心的数据集以反映真实世界的临床多样性。
相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号