编辑推荐:
本文是关于人工智能(AI)在神经外科诊断中应用的系统综述。通过检索多个数据库,分析 193 项研究发现,AI 在神经肿瘤学、血管神经外科等领域有较高诊断准确性,但不同研究的敏感性、特异性等指标存在差异,未来需标准化数据集与模型优化。
引言
人工智能(AI)能让计算机完成需人类认知的任务,在神经外科的多个领域,如神经肿瘤学、血管神经外科、功能神经外科和脊柱神经外科,AI 正越来越多地用于提高诊断精度,辅助复杂手术。机器学习(ML)作为 AI 的子集,通过在患者病史、扫描等数据上训练算法,让 AI 识别模式,进而对新患者进行诊断。目前出现了多种 AI 方法:
- 监督学习:在标记的数据集(如 MRI 图像)上训练模型,用于疾病分类、预测连续变量等,常见算法有逻辑回归(LR)、支持向量机(SVM)、神经网络(NN)等。LR 简单易解释,但需大样本保证准确性;SVM 建模灵活但易过拟合;NN 预测能力强,深度神经网络(DNN)更复杂,预测性能优于传统模型 。
- 无监督学习:在无标记输出的数据集上训练模型,能自主识别模式和聚类数据,可发现新的胶质瘤亚型或检测细微异常。
- 强化学习:AI 根据正确或错误结果获得奖励或惩罚,迭代提高诊断准确性。
- 半监督学习:结合少量标记数据和大量未标记数据,增强检测准确性,对罕见肿瘤类型或细微病理变化的诊断很有用。
研究问题
在接受神经外科疾病诊断评估的患者中,AI 辅助诊断工具在准确性、敏感性和特异性等指标上表现如何?
材料和方法
- 搜索策略:2024 年 9 - 10 月,系统搜索 PubMed、Cochrane Library、中国知网(CNKI)、Embase 和 ClinicalTrials.gov,使用特定术语组合和布尔运算符,确保全面检索相关研究。
- 纳入标准:涉及 AI 在神经外科诊断中的研究、报告定量性能指标、中英文发表、原创研究且聚焦于脊柱疾病、癫痫、神经肿瘤学或脑血管疾病诊断。
- 排除标准:与诊断神经外科无关、缺乏可衡量结果、2020 年前发表、使用未经验证或理论模型无临床应用、撤回的出版物、会议论文等。
- 筛选:使用 Covidence 软件筛选标题和摘要,去除重复文献。两名 reviewers 独立进行筛选,有分歧时经讨论或由第三位 reviewer 裁决,使用 PROBAST 工具评估剩余研究的偏倚风险。
结果
- 数据提取:193 篇文章经两名独立 reviewers 提取数据,收集研究细节、AI 模型信息、数据集信息、目标疾病和性能指标等变量。
- AI 在诊断神经外科的发表情况:近年来,AI 在诊断神经外科的应用研究发表数量急剧增加。
- 发表研究的国家:亚洲在 AI 神经外科研究方面贡献最大,中国发表数量最多,其次是印度、韩国和日本。北美和欧洲也有不少研究成果,其他地区相对较少。
- AI 模型类型:研究中使用的 AI 模型多样,主要包括神经网络(30%)和混合模型(48.2%)。混合模型融合多种技术,反映了 AI 发展初期的创新尝试。
- 训练技术:多数研究(177 篇)采用监督学习,少量研究使用无监督学习、迁移学习和强化学习。
- 输入数据类型:MRI 是最常用的输入数据,其次是 CT、超声和 X 射线 / EEG 等。
- 研究重点分布:研究主要集中在神经肿瘤学(52.69%)、血管神经外科(19.89%)、功能神经外科(16.67%)和脊柱神经外科(11.83%)。
- 性能指标:评估 AI 模型性能最常用的指标是准确性、敏感性、特异性和 AUC。
- AI 模型的准确性
- 神经肿瘤学:在正常与异常组织分类、肿瘤亚型和分级、肿瘤识别和诊断、肿瘤分割和描绘等方面,多数研究的中位数准确率超 85%,但不同研究间各指标存在差异。
- 血管神经外科:在中风检测、颅内出血检测和动脉瘤诊断方面,模型准确性较高,部分指标表现突出,如颅内出血检测的 AUC 中位数达 97%。
- 功能神经外科:在帕金森病、痴呆、癫痫和多发性硬化等疾病的诊断中,部分研究准确率超 90%,但部分研究数据集较小。
- 脊柱神经外科:在脊柱疾病检测和脊柱分割方面,准确性较高,特异性常超 90%,自动分割技术也有不错结果,但仍需临床验证。
讨论
- AI 的应用潜力:AI 在神经外科各亚领域展现出未来应用潜力,许多研究的中位数准确率超 85%。在神经肿瘤学中,能辅助区分肿瘤等级;血管神经外科中,可减少不必要的随访成像;功能神经外科虽数据集小,但诊断准确率高;脊柱神经外科能有效排除假阳性。
- 面临的挑战:AI 模型临床整合困难,存在法律责任问题,且目前研究存在局限性,如缺乏数据加权和荟萃分析、数据收集时间有限、研究质量参差不齐、部分研究偏倚风险较高等。
- 临床转化相关性:AI 有望改善术前规划、术中指导和术后监测,但在临床医生培训、监管审批和融入现有工作流程等方面存在挑战,需多方合作解决。
- 未来展望:未来 AI 发展应注重前瞻性、多中心研究验证,整合多种成像技术,关注罕见病诊断,建立标准化数据集,进行真实世界临床测试。
结论
AI 在神经外科诊断中提高准确性的潜力巨大,在多个领域有较高的诊断准确率。然而,不同研究间敏感性、特异性和 AUC 的显著差异表明,需要标准化数据集和真实世界验证,以确保临床可靠性。未来应聚焦于数据集标准化、模型优化和临床验证,使 AI 技术在神经外科实践中更有效可行。