孟加拉国大学生心理健康危机:基于机器学习的抑郁、焦虑和压力预测模型及影响因素分析

《Journal of Health, Population and Nutrition》:Prevalence, associated factors, and machine learning-based prediction of depression, anxiety, and stress among university students: a cross-sectional study from Bangladesh

【字体: 时间:2025年10月15日 来源:Journal of Health, Population and Nutrition 2.4

编辑推荐:

  本研究针对孟加拉国大学生心理健康问题高发但缺乏综合预测模型的现状,采用横断面调查结合机器学习方法,发现抑郁(56.9%)、焦虑(69.5%)和压力(32.2%)的高流行率,确定家庭关系、性别、吸烟行为等关键风险因素,并通过SVM、CatBoost等模型实现中等预测效能,为LMICs大学生心理健康干预提供数据驱动新范式。

  
在全球范围内,心理健康问题已成为日益严重的公共卫生挑战,而大学生群体由于面临学业压力、社会适应等多重挑战,其心理健康风险尤为突出。特别是在低收入和中等收入国家(LMICs),近半数的青年人口居住于此,心理健康问题更加显著。孟加拉国作为发展中国家,其大学生群体心理健康状况的研究尚不充分,尤其是缺乏将传统统计分析与先进机器学习技术相结合的综合研究。
目前的研究存在明显空白:多数研究依赖于传统的统计方法,样本规模有限,且多集中于单一机构。尽管已有研究报道了孟加拉国大学生心理健康问题的高流行率,但在COVID-19大流行期间,抑郁、焦虑和压力的患病率分别达到46.92-82.4%、26.6-96.82%和28.5-70.1%,但能够全面探讨多种心理健康结局及其预测因素的大规模研究仍然缺乏。此外,利用机器学习(ML)技术预测孟加拉国学生心理健康风险的研究仍处于早期阶段,需要更深入的探索。
为了填补这些空白,Md Emran Hasan等研究人员开展了一项横断面研究,旨在评估孟加拉国大学生抑郁、焦虑和压力的患病率及相关因素,并评估多种机器学习模型对这些结局的预测性能。该研究发表于《Journal of Health, Population and Nutrition》,为制定针对性的干预措施提供了重要证据。
研究人员采用的关键技术方法主要包括:通过横断面调查设计,于2024年2月从孟加拉国两所公立大学(贾汉吉尔纳加尔大学和博杜阿卡利科学技术大学)的1697名住宿学生中收集数据;使用经过验证的孟加拉语版抑郁焦虑压力量表21项(DASS-21)评估心理健康结局;运用卡方检验和二元逻辑回归进行统计分析,并采用K-最近邻(KNN)、随机森林(RF)、梯度提升机(GBM)、极端梯度提升(XGBoost)、类别提升(CatBoost)、逻辑回归(LR)和支持向量机(SVM)等七种机器学习模型进行预测分析。
结果1:研究人群特征
研究共纳入1697名受访者,其中男性占59.9%,女性占40.1%。年龄在21至22岁之间的学生超过三分之一(40.4%),93.3%未婚。社会经济阶层分布为低收入(32.2%)、中等收入(41.7%)和高收入(23.9%)。绝大多数学生(72.4%)来自核心家庭,89.8%表示家庭关系友好。69.3%参与者为一年级学生,58.2%在理学院学习,22.5%有吸烟史。
结果2:抑郁、焦虑和压力的患病率与严重程度
研究发现抑郁、焦虑和压力的患病率分别为56.9%(n=966)、69.5%(n=1179)和33.2%(n=564)。严重程度分析显示:28.6%学生抑郁水平正常,14.4%轻度,29.4%中度,16.6%重度,11.0%极重度;焦虑方面24.0%正常,6.5%轻度,25.4%中度,15.8%重度,28.3%极重度;压力方面50.4%正常,16.4%轻度,18.3%中度,10.9%重度,4.0%极重度。
结果3:社会人口学和健康相关因素与心理健康结局的关联
性别与抑郁(χ2=3.863, p=0.049)和压力(χ2=6.727, p=0.009)显著相关,男性抑郁比例更高(61.9% vs 38.1%),而女性压力比例更高(55.5% vs 44.5%)。家庭关系与所有心理健康结局显著相关:抑郁(χ2=15.623, p<0.001)、焦虑(χ2=5.897, p=0.015)和压力(χ2=28.110, p<0.001)。学习年限与压力显著相关(χ2=11.179, p=0.011),一年级学生压力率更高。学院与抑郁(χ2=28.669, p<0.001)和焦虑(χ2=7.302, p=0.026)显著相关,商学院学生抑郁(73.9%)和焦虑(69.7%)患病率最高。吸烟与抑郁(χ2=12.859, p<0.001)、焦虑(χ2=3.878, p=0.049)和压力(χ2=6.741, p=0.009)显著相关。
结果4:心理健康结局的影响因素
调整后的逻辑回归模型显示:女性与压力风险增加1.588倍相关(p=0.001);不友好家庭关系使抑郁风险增加1.615倍(p=0.031),压力风险增加1.943倍(p=0.002);与一年级相比,二、三、四年级学生压力风险比值比分别为1.136、1.074和0.344(p=0.039);文商学院学生抑郁风险高于理学院(p<0.0001);吸烟是压力(OR=1.652, p=0.003)和抑郁(OR=1.450, p=0.026)的显著因素。
结果5:特征重要性分析
SHAP分析显示,学院、吸烟状况和家庭关系是顶级预测因子。CatBoost SHAP值表明这些特征对模型预测贡献最大,而婚姻状况、饮酒状况和当前居住地重要性较低。
XGBoost特征重要性分析显示,家庭关系(增益值=1.25)和性别(增益值=0.85)是最重要特征,其次是学院、学习年限和社会经济状况。
结果6:机器学习模型性能评估
SVM在抑郁预测中表现最佳(准确率=56.93%,精确度=75.60%,对数损失=0.6847);LR在焦虑预测中表现最佳(准确率=69.48%,精确度=78.81%);CatBoost在压力预测中表现最佳(准确率=67.06%,精确度=64.54%,F1分数=0.5777,对数损失=0.6284)。ROC曲线显示所有模型的判别性能中等(AUC≥0.5),表明预测能力有限。
研究结论与讨论部分强调,孟加拉国大学生心理健康问题患病率高,特别是焦虑(69.5%)和抑郁(56.9%)。确定的关键风险因素包括不友好家庭关系、女性性别、高年级学业压力、商学院专业和吸烟行为。机器学习模型虽仅显示中等预测性能,但证实了数据驱动方法在识别复杂风险模式方面的价值。
本研究的重要意义在于首次将传统流行病学分析与先进机器学习方法相结合,全面探讨孟加拉国大学生多种心理健康结局及其预测因素。研究结果支持实施校园心理健康筛查、可及性咨询和同伴支持计划,突出了数据驱动方法在制定针对性大学心理健康政策方面的价值。特别是在LMICs背景下,为资源有限环境中的心理健康干预提供了新思路。
研究的局限性包括横断面设计无法推断因果关系、样本仅限于两所公立大学、自报数据可能存在偏差,以及机器学习模型判别性能有限。未来研究应纳入更多特征如数字行为标记或纵向数据,并扩大至私立大学学生,以提升模型的预测能力和结果的普适性。
总之,该研究为孟加拉国乃至类似LMICs的大学生心理健康干预提供了重要证据,强调需要针对家庭关系、物质使用和学业压力制定文化适应性干预措施,并展示了机器学习在心理健康研究中的应用潜力。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号