编辑推荐:
为解决 ICAS 早期检测难题,挪威北极大学研究人员开展用机器学习预测 ICAS 的研究。结果显示,依临床数据预测 ICAS 准确率可达 81%,但 PPV 仅 19%。该研究揭示患病率影响,为 ICAS 检测及模型评估提供新思路,值得一读。
在医学的广阔领域中,颅内动脉粥样硬化性狭窄(ICAS)就像一颗隐藏在身体里的 “定时炸弹”。它是指由于血管壁内斑块堆积,导致颅内动脉变窄,进而限制了血液流动。这可不是个小问题,ICAS 不仅是缺血性中风的重要危险因素,还和认知障碍、痴呆等疾病有着千丝万缕的联系。你知道吗?在那些致命的中风患者里,有相当一部分人都被 ICAS “盯上” 了。而且,随着动脉狭窄程度的加重,尤其是狭窄程度大于等于 70% 时,中风的风险就像火箭一样飙升。
然而,ICAS 的 “真面目” 却很难被看清。在不同的研究中,它在人群中的患病率差异很大,低的只有 3%,高的能到 12%。医院样本中的患病率更是波动剧烈,从 9% 到 65% 都有。造成这种差异的原因,主要是诊断方法不同,以及研究选取的人群样本有别。早期发现 ICAS 对于预防严重后果至关重要,但现有的诊断方法既费力又费钱,还需要专业的技术人员操作。
近年来,机器学习在医疗领域崭露头角,就像给医学诊断带来了新的 “魔法棒”。在神经放射学的一些应用中,比如检测动脉瘤,机器学习取得了不错的成果。可奇怪的是,在检测 ICAS 方面,它却有点 “力不从心”。过去四年里,相关的研究少之又少,仅有的两种方法在性能上也不太理想,还没办法成为临床上得力的诊断工具。这是为什么呢?原来,ICAS 的特征比动脉瘤更隐蔽、更难发现。
为了攻克这个难题,来自挪威北极大学(UiT The Arctic University of Norway)的研究人员在《BMC 医学信息学与决策制定(BMC Medical Informatics and Decision Making)》期刊上发表了一篇名为《利用机器学习从稀疏风险因素预测颅内动脉粥样硬化性狭窄:患病率的重要性(Predicting Intracranial Atherosclerotic Stenosis from Sparse Risk Factors Using Machine Learning: The Importance of Prevalence)》的论文。他们的研究就像是一场医学探索之旅,为我们揭开了 ICAS 检测的新面纱。
研究人员在这场探索之旅中使用了不少 “秘密武器”。首先,他们从 2015 - 2016 年的第 7 次特罗姆瑟研究(The 7th Troms? study)中获取了宝贵的数据,这些数据涵盖了 40 岁及以上居民的人口统计学信息和健康数据。在众多参与者中,有 1847 人接受了脑部 MRI 扫描,其中包括 3D 时间飞跃血管造影序列,这些数据成为了研究的重要基础。为了让数据更 “公平”,面对不均衡的数据分布(非 ICAS 病例约 1700 例,ICAS 病例仅 111 例),他们采用了随机欠采样技术,创建了平衡的训练数据集。然后,他们挑选了三个 “得力助手”—— 支持向量机(SVM)、多层感知器(MLP)和 Kolmogorov - Arnold 网络(KAN),用这三种机器学习模型来预测 ICAS。最后,为了全面评估模型的表现,他们使用了灵敏度、特异性、准确性以及通过贝叶斯定理计算出的预测值等多种指标。
研究结果
- ICAS 患者的特征:研究人员发现,ICAS 患者和非 ICAS 患者相比,就像两个不同的 “阵营”。ICAS 组里男性更多,年龄更大,患高血压和糖尿病的比例更高,BMI 也更高,而高密度脂蛋白胆固醇(HDL)水平却更低。这些特征就像是 ICAS 患者身上的 “特殊标记”,为后续的研究提供了重要线索。
- 模型性能大比拼:在这场模型的 “较量” 中,SVM、MLP 和 KAN 都拿出了自己的 “看家本领”。SVM 的平均测试准确率为 78%,特异性为 67%,灵敏度为 89%;MLP 表现得更出色一些,平均测试准确率达到 81%,特异性为 76%,灵敏度为 89%;KAN 的平均测试准确率和 SVM 一样是 78%,特异性为 74%,灵敏度为 83%。从这些数据可以看出,MLP 在这场 “比赛” 中暂时领先。不过,研究人员并没有就此满足,他们还深入研究了预测值。结果发现,虽然 MLP 的灵敏度高达 89%,但由于 ICAS 在人群中的患病率只有 6%,受此影响,其阳性预测值(PPV)仅为 19%,阴性预测值(NPV)却高达 99%。这就好比一个看似很厉害的 “神箭手”,虽然射中目标的能力很强(高灵敏度),但因为目标本身太罕见(低患病率),真正能准确判断出目标的概率(PPV)却不高。
- PPV 与灵敏度、特异性的关系:研究人员还发现,PPV 和灵敏度、特异性之间有着有趣的关系。当把灵敏度和特异性设置为相等,并保持患病率不变时,通过绘制图表发现,想要有 80% 的把握正确诊断患者为阳性,灵敏度和特异性都至少要达到 95%。这就像在一场严格的考试中,想要取得高分(高 PPV),两个关键科目(灵敏度和特异性)都得达到很高的分数才行。而且,虽然这个结论是基于本次研究得出的,但在其他疾病患病率低的临床诊断方法中,也有类似的趋势。
研究结论和讨论
这项研究就像一把钥匙,为 ICAS 的检测打开了新的大门。研究人员发现,利用基本的临床和人口统计学数据,竟然能在 ICAS 的分类上取得比那些昂贵的成像技术检测算法更高的准确率。这就意味着,临床数据就像一座隐藏的 “宝藏”,可以用来丰富图像数据,进一步提高 ICAS 检测的准确性。不过,研究也发现了问题,尽管模型的灵敏度不低,但 PPV 却很低,这让我们不得不重新审视这些科学预测模型在实际临床中的价值,尤其是对于那些患病率低的疾病。
目前,很多医学研究在引入预测深度学习方法时,常常忽略疾病患病率这个关键因素。但实际上,患病率对诊断测试的准确性影响很大,它直接关系到预测模型的临床相关性。PPV 能直接告诉患者诊断正确的可能性有多大,在患病率低的情况下,它的数值会受到很大影响,进而影响模型对患者的实际意义。
从这次研究中,我们还能看到未来的研究方向。以后在检测颅内狭窄的预测模型研究中,应该像临床医生诊断一样,综合考虑多方面的数据,采用多模块深度学习方法,充分利用各种数据,以提高诊断性能。比如,可以通过多头注意力层把图像的特征空间和人口统计学数据融合起来。
总的来说,这项研究不仅证明了临床和人口统计学数据在 ICAS 预测中的潜力,还让我们看到了患病率在评估模型临床相关性中的重要地位。它就像一盏明灯,为后续的医学研究照亮了道路,提醒着研究人员在开发和评估医学预测模型时,一定要把患病率这个重要因素考虑进去,这样才能让研究成果真正造福患者。