编辑推荐:
痴呆诊断形势严峻,为解决现有非神经影像痴呆预测模型的局限,研究人员利用澳大利亚(AIBL)和美国(ADNI)队列数据开展研究。结果显示 APOE 基因型是痴呆诊断的最佳预测指标,该研究为痴呆诊断提供新思路,助力早期诊断干预。
在全球老龄化加剧的大背景下,痴呆问题愈发严峻。如今,超过 5500 万人饱受痴呆症的困扰,而且每年新增病例高达 1000 万。痴呆不仅是 65 岁以上老年人致残的主要原因,还让全球经济每年承受超过 1.3 万亿美元的沉重负担。及时诊断痴呆意义重大,它能让患者及其家人尽早获得支持和干预,提高生活质量,延长患者独立生活的时间,同时减轻医疗负担。
然而,当前多数痴呆诊断模型依赖神经影像技术,像磁共振成像(MRI)和正电子发射断层扫描(PET)。这些模型虽然性能和预测能力出色,但在实际临床应用中却困难重重。一方面,神经影像检查费用高昂,许多患者因健康保险覆盖不足或自付费用过高而难以承受;另一方面,偏远地区的患者更是面临检查不便的难题,而且检查等待时间长,还需要专业人员处理和解读结果,这使得痴呆诊断常常被延误。
为了解决这些问题,来自澳大利亚和美国的研究人员展开了深入研究。他们的研究成果发表在《Translational Psychiatry》杂志上。
研究人员从澳大利亚的 AIBL 和美国的 ADNI 这两个公开数据库获取数据。这些数据涵盖了参与者的医疗史、血液检测结果以及 APOE 基因型信息等 21 项临床变量。研究人员运用多种机器学习算法,包括基于树的算法(如分类和回归树(CART)、随机森林、梯度提升机(GBM)、极端梯度提升(XGBoost))和人工神经网络等。
研究结果如下:
- APOE 基因型的重要性:研究人员将 AIBL 和 ADNI 队列合并成一个大型数据集进行分析,发现 APOE 基因型对痴呆诊断的效用最高。在包含 APOE 基因型作为特征的模型中,神经网络的敏感性可达 0.83,阳性预测值(PPV)为 0.73 。通过 SHAP 分析进一步证实,APOE 基因型对模型预测痴呆诊断的贡献最大,是识别痴呆患者的关键因素。而尿素氮测试对模型性能也有一定贡献,但相对较小,主要在识别健康对照方面发挥作用。当排除 APOE 基因型后,所有模型的性能显著下降,这充分凸显了 APOE 基因型在痴呆诊断模型中的核心地位。
- 模型的泛化性问题:研究人员分别用 ADNI 和 AIBL 数据集进行训练和测试,发现模型的预测能力存在差异。当用 ADNI 数据集训练模型并在 AIBL 数据集测试时,模型的敏感性大幅下降,仅在 0.25 - 0.36 之间;而用 AIBL 数据集训练并在 ADNI 数据集测试时,敏感性有所提升,但特异性又降低了。深入研究发现,这种差异主要是由于 ADNI 和 AIBL 队列中 APOE 基因型的相对分布不同。在 AIBL 队列中,APOE4 携带者被误判为痴呆患者的情况较多,导致假阳性率高;而在 ADNI 队列中,APOE4 非携带者被误判为健康对照的情况相对较多,出现了一定数量的假阴性。进一步对 ADNI 和 AIBL 数据集分别进行独立分析发现,在 ADNI 数据集中,模型能很好地预测痴呆病例,敏感性较高;而在 AIBL 数据集中,模型则更擅长预测健康对照,这再次表明 APOE 基因型在不同队列中的预测效果存在差异。
在讨论部分,研究人员指出,尽管利用 “易于获得” 的临床指标开发痴呆诊断模型意义重大,但目前使用公开队列数据存在一些局限性。比如不同队列之间数据的一致性难以保证,像血液检测中尿素氮结果的差异可能与测量单位不同有关,但由于缺乏相关信息无法确定,这不仅限制了模型的临床应用,也影响了对模型的解释和推广;而且不同队列之间还存在许多变量缺失的情况,可能会影响模型的泛化性。不过,APOE 基因型始终是痴呆和健康对照的最强预测指标,它成本低、易获取且结果易解读,未来应考虑将其作为初级保健诊所中痴呆早期诊断的常规检测手段。
综上所述,这项研究为痴呆的诊断提供了重要的参考依据,明确了 APOE 基因型在痴呆预测模型中的关键作用,同时也指出了当前研究中存在的问题,为后续研究指明了方向,对推动痴呆早期诊断和干预具有重要意义。