
-
生物通官微
陪你抓住生命科技
跳动的脉搏
同伴关系是青少年心理健康危机的直接诱因:基于两大队列研究的可解释机器学习分析
【字体: 大 中 小 】 时间:2025年06月06日 来源:JMIR Public Health and Surveillance 3.5
编辑推荐:
推荐:针对西方社会近十年加剧的青少年心理健康危机,研究人员通过英国Millennium cohort(MC)和德国KiGGS两大纵向队列(n=9811),采用可解释机器学习(gradient boosting regression)构建预测模型,发现同伴问题(peer problems)是心理健康恶化的直接原因(效应量r=0.614/0.466),而屏幕时间(screen time)和体力活动(physical inactivity)的直接影响较小,为制定针对性干预策略提供了循证依据。
近年来,西方社会青少年心理健康危机呈现爆发式增长,情绪问题发生率在2010年后显著上升,英国2000-2002年出生青少年的情绪问题比1991-1992年出生群体增加近一倍,荷兰2008至2021年间情感障碍发病率几乎翻番。这场危机被归因于屏幕时间增加、体力活动减少和社会孤立等多种因素,但各因素的因果关联和相对贡献始终缺乏系统论证。
为破解这一难题,来自英国和德国的研究团队创新性地将可解释机器学习技术应用于两大代表性队列——英国千禧世代研究(MC,n=8599)和德国儿童青少年健康调查(KiGGS,n=1212)。研究采用梯度提升回归(gradient boosting regression)构建预测模型,通过10次重复10折交叉验证,成功实现青少年后期(16-17岁)心理健康状态的中高精度预测(Pearson相关系数r=0.614和0.466)。研究团队特别运用排列特征重要性分析和因果推断框架下的偏依赖分析,首次量化了三大争议因素的独立效应。
关键技术包括:1) 基于父母报告SDQ-E(Strength and Difficulties Questionnaire-Emotional)量表评估心理健康;2) 使用含144(MC)和102(KiGGS)个预测变量的多维数据集;3) 采用K近邻插补处理缺失值;4) 通过HistGradientBoosting算法建模非线性关系;5) 应用Alibi工具箱进行排列特征重要性分析。
【预测模型性能】非线性模型显著优于线性模型(KiGGS队列r提升21.4%),证实心理健康发展存在复杂非线性关系。基线心理健康问题是最强预测因子,但其他因素共同贡献了38.6%-46.6%的预测方差。
【关键预测因子】特征重要性分析揭示:父母心理健康问题(效应量β=-0.18至-0.22)、慢性疾病(β=0.12-0.15)、女性性别(β=0.10-0.13)及低社会经济地位(父母教育程度β=-0.08至-0.11)构成核心风险因素集群。
【因果效应解析】通过固定其他变量模拟干预显示:1) 同伴关系改善可使SDQ-E得分降低1.2-1.8分(P<0.001),效应呈非线性放大;2) 体力活动增加仅在高不活动群体产生微弱改善(ΔSDQ-E=0.3分);3) 屏幕时间缩减在MC队列无显著效应,在KiGGS队列仅极高使用组出现0.5分改善。
这项发表于《JMIR Public Health and Surveillance》的研究具有双重突破:方法学上,首次将可解释机器学习与因果推断结合应用于青少年心理健康预测;实质上,确证同伴关系恶化是心理健康危机的直接驱动因素。研究为公共卫生干预指明优先方向——相较于争议性的屏幕时间限制,提升社交技能训练和反欺凌项目可能获得更大收益。作者特别指出,屏幕时间可能通过恶化同伴关系产生间接影响,这为后续机制研究提供了重要线索。该成果为理解当代青少年心理健康危机的成因谱系提供了量化证据,对制定精准预防策略具有里程碑意义。
生物通微信公众号
知名企业招聘