编辑推荐:
为解决自身免疫性脑炎(AE)可靠且快速诊断的难题,研究人员开展了基于机器学习预测疑似 AE 患者抗体血清状态的研究。结果显示,基于影像组学(Radiomics)的机器学习模型预测性能良好。这有助于优化实验室资源配置,加速 AE 诊断。
在医学的神秘世界里,自身免疫性脑炎(Autoimmune Encephalitis,AE)就像一个隐藏在暗处的 “神秘杀手”。它是由于身体的免疫系统误把大脑当作敌人进行攻击,从而引发炎症。过去,人们一直认为 AE 极为罕见,可 recent studies 却发现,它的患病率几乎和传染性脑炎一样高。但 AE 的症状多种多样,像精神状态改变、短期记忆障碍、癫痫发作等,都缺乏特异性,这使得不少医生在诊断时如同雾里看花,导致 AE 常常被漏诊。而且,AE 的诊断目前主要依赖临床症状、抗体检测和影像学检查,可即便借助这些手段,诊断过程依旧困难重重。比如,约 50% 的疑似 AE 患者无法检测到抗体,只能依靠临床标准诊断;MRI 成像虽然对诊断有帮助,但影像表现复杂,从无明显异常到海马体萎缩都有,让诊断更加棘手。为了突破这些困境,来自德国明斯特大学诊所放射科等机构的研究人员踏上了探索之旅,他们开展了一项极具意义的研究,相关成果发表在《Scientific Reports》上 。
研究人员为了实现通过机器学习预测疑似 AE 患者抗体血清状态的目标,采用了一系列关键技术方法。他们从医院数据库中回顾性筛选出 2009 年 3 月至 2022 年 2 月确诊为 AE 的患者,最终确定了 98 例患者作为研究对象 。利用开源软件 3D Slicer 对 T2 加权磁共振(MRI)图像进行海马体手动双侧分割,再借助 PyRadiomics 软件包提取 107 个影像组学特征 。随后,运用 R 软件进行统计分析,将患者随机分为训练组和独立测试组,采用分层 4:1 的比例,确保两组中抗体阳性和阴性患者分布均衡 。同时,测试了 6 种不同的机器学习算法,包括随机森林算法、朴素贝叶斯、线性判别分析(LDA)、套索回归(Lasso regression)、岭回归和神经网络,以此来构建预测模型 。
下面来看具体的研究结果:
- 模型性能评估:研究人员测试的 6 种机器学习算法在预测抗体状态时表现各异 。朴素贝叶斯算法的判别能力最差,仅用三个特征就出现了过拟合现象;线性判别分析(LDA)和随机森林算法的判别能力也相对较低 。而套索回归(Lasso regression)在 6 种算法中表现最佳,当模型包含 7 个特征时,能达到最高的判别能力 。此时,平均 AUC 为 0.918,平均准确率为 0.861,平均灵敏度为 0.875,平均特异性为 0.843,平均阳性预测值(PPV)为 0.893,平均阴性预测值(NPV)为 0.847 。
- 重要特征分析:研究发现,“球形度(Sphericity)” 是所有模型中最重要的特征之一 。在套索回归(Lasso regression)的 7 特征模型中,“扫描时年龄(Age_at_scan)” 和 “球形度(Sphericity)” 在所有模型中都存在,“相关性(Correlation)” 和 “灰度非均匀性(GrayLevelNonUniformity)” 在几乎所有模型中都出现 。进一步分析表明,6 特征的套索回归(Lasso regression)模型就有很高的预测性能,平均 AUC 达到 0.950,平均准确率为 0.892,平均灵敏度为 0.892,平均特异性为 0.891,平均阳性预测值(PPV)为 0.926,平均阴性预测值(NPV)为 0.872 。
- 特征影响力研究:研究人员还分别探究了患者年龄和影像组学特征对模型判别能力的影响 。仅包含患者年龄的单变量模型平均 AUC 为 0.649,加入性别后,判别能力并未提升 。而仅包含 6 个最重要影像组学特征(不包括患者年龄)的模型,平均 AUC 为 0.856,这表明影像组学特征本身就具有很强的判别能力 。此外,与传统的逻辑回归算法相比,套索回归(Lasso regression)由于包含额外的正则化项,判别能力略胜一筹 。
综合研究结果和讨论部分来看,这项研究意义非凡。它首次证明了基于影像组学的机器学习能够可靠地预测疑似 AE 患者的血清状态,为 AE 的诊断提供了新的方向 。未来,这种方法有望优化实验室资源的分配,针对血清阳性的患者进行更精准的抗体诊断 。不过,研究也存在一些局限性,比如回顾性研究的性质、缺乏正常对照组、样本量相对较小、海马体手动分割可能存在偏差等 。但这并不影响其重要价值,后续还需要更大规模的前瞻性研究来进一步验证和完善这些结果,推动 AE 诊断技术的不断进步,让更多患者受益。