基于机器学习预测韩国青少年自杀风险:开启精准干预新征程

【字体: 时间:2025年04月29日 来源:Scientific Reports 3.8

编辑推荐:

  自杀风险预测难题待解,研究人员开展 “基于机器学习预测韩国青少年自杀风险” 的研究。他们对比 6 种 ML 模型,发现 GBM 模型表现最佳。该研究为青少年自杀行为早期干预提供依据,助力提升心理健康水平。

  在全球范围内,自杀已成为严重的公共卫生问题。对于 15 - 29 岁的人群而言,自杀是第三大死因,每年有超 72 万人因此失去生命 。在韩国,2023 年自杀更是位列第五大死因,自杀死亡率升至每 10 万人中有 27.3 人。更令人担忧的是,10 - 30 岁人群中,故意自我伤害成为首要死因。青少年时期是心理健康发展的关键阶段,若在此期间出现的心理问题未得到及时干预,可能会带来长期不良后果,影响成年后的身心健康。一项针对 9000 名 11 - 18 岁青少年的全国性调查显示,4.7% 的参与者 “经常” 考虑自我伤害和自杀,26.5%“有时” 会有自杀念头。学术压力、家庭冲突和校园暴力等都是导致这些问题的关键因素。自杀问题不仅严重威胁青少年的生命安全,还带来了沉重的经济负担,韩国的自杀治疗费用高达 5.3 万亿韩元,给医疗系统造成了巨大压力。
传统的临床风险评估工具在识别自杀高风险个体方面存在明显不足,难以可靠地预测自杀行为。常规的统计模型,如逻辑回归和生存分析,在捕捉自杀风险相关的非线性关系时也存在局限性。虽然机器学习(ML)技术已逐渐应用于精神科护理领域,但目前针对青少年自杀风险预测的研究仍存在诸多问题。现有研究大多存在样本偏差和泛化性有限的问题,数据来源也较为局限,无法全面反映不同文化、社会经济和地理背景下自杀风险的复杂性。此外,当前预测模型的准确性也有待提高。

为了解决这些问题,来自庆北国立大学(Department of Physical Education, Kyungpook National University)、世宗大学(Department of Physical Education, Sejong University)、成均馆大学(Department of Financial Technology, Sungkyunkwan University)和湘潭大学(Xiangtan University)等机构的研究人员开展了一项关于基于机器学习预测韩国青少年自杀风险的研究。该研究成果发表在《Scientific Reports》上,为青少年自杀风险预测和早期干预提供了新的思路和方法。

研究人员运用了多种关键技术方法。数据来源于韩国疾病控制与预防机构 2022 年开展的韩国青少年风险行为网络调查(KYRBS),该调查采用复杂抽样设计,涵盖全国初高中学生,保证了样本的代表性。在建模和分类方面,研究人员依据算法多样性、预测性能与可解释性平衡、处理不均衡类别分布能力以及超参数优化空间等标准,选取了逻辑回归(LR)、决策树(DT)、支持向量机(SVM)、梯度提升机(GBM)、极端随机树(ET)和分布式随机森林(DRF)6 种模型进行分析,并利用 5 折交叉验证对超参数进行优化。为了评估模型性能,研究人员采用了包括准确率(ACC)、灵敏度(SENS)、特异性(SPEC)、阳性预测值(PPV)、阴性预测值(NPV)和曲线下面积(AUC)等指标。同时,研究人员运用了 SHapley Additive exPlanations(SHAP)值和排列特征重要性(PFI)进行可解释性分析,还利用交互分析探究自杀风险相关关键变量之间的复杂关系。

研究结果


  1. 样本特征:在 51850 名青少年参与者中,7806 人(15%)表现出自杀行为。自杀行为组在心理健康、孤独感、压力、健康自评等多个维度与非自杀行为组存在显著差异。例如,自杀行为组中 31.96% 的人有抑郁症状,48.55% 感到孤独,34.46% 处于极端压力下。在生活方式方面,自杀行为组的不健康行为更为普遍,如 78.06% 饮食不规律,31.25% 频繁喝咖啡 。
  2. 特征选择:研究整合了专家咨询法(ECM)和基于随机森林的过滤特征选择(RFFS)两种方法。ECM 基于专家临床知识等选定 20 个核心特征,RFFS 通过客观定量分析确定 12 个重要变量,两者结合确定了预测青少年自杀风险的关键变量。
  3. 模型评估:在 ECM 数据集上,LR 和 GBM 表现出色,ACC 达到 88%,SENS 为 97%,AUC 为 83%;在 RFFS 数据集上,SVM 和 GBM 性能稳定,LR 和 GBM 的 AUC 均为 83%。综合考虑,GBM 因在处理不均衡数据集等方面的优势被优先选择进一步分析。
  4. 多变量交互和特征效应:GBM 模型在不同数据集和特征选择比例下表现稳定。对于 ECM 数据集,选择前 25% 的特征后,SENS 增加,SPEC 略有下降;RFFS 数据集前 25% 特征的 NPV 低于全特征集,但整体模型性能受影响较小 。
  5. 特征重要性:通过 PFI 和 SHAP 分析发现,压力是影响中学生自杀行为的关键因素,而抑郁对高中生自杀行为的影响最大。同时,抑郁、焦虑、压力和孤独之间存在复杂的相互作用,如在高抑郁水平下,低焦虑与自杀风险降低显著相关,压力和焦虑之间呈正相关 。

研究表明,GBM 模型在预测青少年自杀风险方面表现出色,ACC 可达 83% - 88%,SENS 为 97%,优于以往基于学校和生活数据的研究模型。该模型能在短时间内检测出高危人群的短期自杀风险,且在处理不同数据集和特征选择策略时具有较强的适应性和稳定性。

此外,研究明确了影响青少年自杀风险的关键因素。心理健康状况在自杀风险预测中最为重要,不同年龄段的关键预测因素存在差异,中学生主要受压力影响,高中生则主要受抑郁影响。这些发现强调了针对不同年龄段制定个性化心理健康干预措施的重要性。同时,研究还揭示了心理因素之间的复杂交互作用,为深入理解自杀风险机制提供了依据,有助于开发更具针对性的心理健康干预措施。

然而,该研究也存在一定局限性。由于研究设计的原因,无法确定严格的因果关系,难以深入了解长期风险动态。研究样本主要来自学校人群,未涵盖所有青少年群体,尤其是校外青少年。数据收集采用回顾性自我报告方式,可能存在回忆偏差和漏报风险,且可能遗漏了一些重要的自杀风险预测因素,研究结果还可能受韩国特定文化背景的影响。

尽管如此,这项研究仍具有重要意义。它证明了全国性调查数据在提升自杀风险预测准确性方面的关键作用,成功识别出易受自杀风险影响的青少年群体,为早期干预提供了重要依据。同时,研究揭示的心理因素之间的复杂交互作用,突破了传统线性模型的局限,为将青少年心理健康作为新的数字生物标志物用于自杀风险评估奠定了基础,为青少年心理健康研究和干预开辟了新的方向。未来研究可在此基础上,开展前瞻性纵向研究,扩大样本规模和多样性,开发更复杂的干预模型,以更好地支持青少年心理健康。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号