编辑推荐:
痴呆(Dementia)严重威胁全球健康,抑郁(Depression)又与痴呆风险紧密相关。为填补痴呆风险预测工具在抑郁人群应用的空白,研究人员开展了基于机器学习算法的队列研究。他们开发并验证了预测模型,还部署至网络应用,为痴呆风险预测提供了新工具。
在全球范围内,痴呆已成为严重的公共卫生问题,它是全球第七大死因,全球约有 5500 万成年人受其困扰,且预计每二十年患病率就会翻倍。尽管科研人员投入大量精力探索病因和预防策略,但至今仍未找到有效的疾病修正疗法。与此同时,抑郁作为一种常见的精神障碍,影响着全球超 3 亿人,是全球疾病负担的主要成因之一。而且,有证据表明,抑郁患者患痴呆的风险显著高于非抑郁人群,这一关联在多项纵向队列研究中得到证实。现有痴呆风险预测模型多基于普通人群开发,在抑郁人群中缺乏针对性,存在依赖难以获取的生物标志物等局限性,无法满足抑郁人群痴呆风险分层的临床需求。
为了攻克这些难题,南昌大学第二附属医院以及江西省智能医学影像重点实验室的研究人员展开了一项大规模的纵向诊断研究。他们利用机器学习技术,基于英国生物银行(UK Biobank)的综合前瞻性队列数据,开发并验证了一种专门针对中老年抑郁人群的痴呆风险预测模型,并将其部署到网络应用程序中。该研究成果发表在《Alzheimer's Research & Therapy》杂志上,为痴呆风险预测领域带来了新的突破。
研究人员开展此项研究时,运用了多种关键技术方法。首先,他们从 UK Biobank 中选取了 502,386 名年龄在 37 - 73 岁之间的参与者数据,其中 31,587 名被确定为患有抑郁症。在变量选择方面,研究人员从最初的 190 个候选变量中,经过多阶段严格筛选,最终确定了 27 个与痴呆相关的变量,随后又通过前向特征子集选择算法进一步简化模型,保留了 12 个变量。在模型开发和验证过程中,研究人员运用了 8 种不同的数据分区和验证方案,并使用了 CatBoost、AdaBoost 和 XGBoost 这三种机器学习分类器对模型性能进行评估。
研究结果
- 人口特征:研究最终纳入 31,587 名抑郁参与者,平均年龄 56.23 ± 8.10 岁 ,女性占比 63.50%。在中位随访 7.98 年期间,896 名(2.80%)参与者发展为痴呆,30,691 名(97.20%)未患痴呆。痴呆组基线年龄显著高于非痴呆组,且在睡眠问题、肥胖、饮酒频率等方面存在差异12。
- 27 变量模型的开发与验证:经过筛选得到的 27 个变量被用于开发痴呆风险预测模型。通过比较发现,在 8 种数据分区方案中的 Study 4 中,AdaBoost 分类器表现最佳,AUC 为 0.861 ± 0.003,XGBoost 和 CatBoost 模型的 AUC 分别为 0.839 ± 0.005 和 0.828 ± 0.007 。各模型在测试集和训练集上均表现出较好的性能34。
- 简化模型的开发与验证:为提高模型的社区推广性和临床适用性,研究人员开发了包含 12 个变量的简化模型。该模型在 Study 4 中,AdaBoost 分类器的 AUC 为 0.859 ± 0.002,依然保持最佳性能,XGBoost 和 CatBoost 模型的 AUC 分别为 0.835 ± 0.001 和 0.821 ± 0.005 。交叉验证分析证实了简化模型的稳健性56。
- 模型解释与可视化:研究人员通过变量贡献排名和 SHapley Additive exPlanations(SHAP)图分析,对 12 变量简化模型进行解释。结果显示,年龄、抑郁持续时间和就业状况对模型的贡献最大。多变量 Cox 回归模型分析发现,失业状态、男性性别和年龄是痴呆的风险因素,而使用手机时长 2 年或以上、有内疚感和过去看过精神科医生是保护因素78。
- 模型比较与稳健性分析:DeLong's 检验表明,12 变量简化模型和 27 变量模型的 AUC 值无显著差异,证明了简化模型的可行性。同时,研究发现不同机器学习分类器的性能存在显著差异,AdaBoost 在 12 变量和 27 变量模型中均表现最佳。通过 50 次随机子采样计算进行的稳健性分析显示,模型性能稳定910。
- 网页应用部署:研究人员将最优的 12 变量简化模型部署到网络应用程序 DRP-Depression 中,该应用可为中老年抑郁人群提供个性化的痴呆风险预测、详细的测试报告和个性化的预防建议。通过一个临床案例可知,该应用对一名 54 岁男性的痴呆风险预测与实际临床诊断相符1112。
- 敏感性分析:通过排除近期诊断为抑郁症的病例进行敏感性分析,结果显示,排除诊断抑郁症 6 个月内和 2 年内的病例后,模型的 AUC 分别为 0.838(95% CI 0.832 - 0.845)和 0.802(95% CI 0.797 - 0.807) ,与主要分析结果一致,进一步证明了模型的稳健性1314。
研究结论与讨论
在这项前瞻性研究中,研究人员成功开发了一种基于机器学习算法的痴呆风险预测模型,用于识别中老年抑郁人群中的高风险个体。该模型具有较高的分类准确率(98%)和 AUC 值(0.859 ± 0.002 ),且模型中的变量易于获取,便于实际应用。通过多种验证范式和稳健性分析,模型的稳定性和可解释性得到了充分验证。此外,研究人员还将模型部署到公开的网络应用程序中,为社区和心理健康领域的痴呆风险量化提供了便利。
然而,该研究也存在一些局限性。例如,研究队列主要为欧洲血统,需要在多民族队列中进一步验证其普遍性;部分变量由主观评估,可能存在分类错误;研究人群均为住院患者,可能存在选择偏倚;尽管进行了严格的特征选择,仍可能遗漏一些潜在变量;痴呆组和非痴呆组人数差异较大,可能导致数据集类别不平衡。
总体而言,这项研究为痴呆风险预测提供了新的方法和工具,有助于早期识别抑郁人群中的痴呆高风险个体,为个性化预防和干预提供依据,在痴呆预防和控制领域具有重要的临床意义和应用潜力。