编辑推荐:
在全球范围内,尤其是在中低收入国家,精神障碍负担沉重,卢旺达青年中患病率较高。为解决这一问题,研究人员开展了基于机器学习预测卢旺达青年心理健康及风险因素的研究。结果表明随机森林模型效果最佳,且明确了关键风险因素。这为制定干预政策提供依据。
在当今世界,精神健康问题如同隐藏在暗处的 “杀手”,悄然影响着无数人的生活。全球范围内,每八个人中就有一人饱受精神健康障碍的折磨,而中低收入国家更是承受着约 75% 的精神和行为障碍负担,其中大部分患者未能得到及时治疗。在非洲,随着人口增长,精神健康问题的患病率呈上升趋势,年轻人在生活压力下,心理健康状况愈发令人担忧。卢旺达,这个经历过 1994 年种族灭绝的国家,精神健康问题尤为突出,在图西族大屠杀幸存者中,精神障碍患病率高达 53.3% ,普通人群中也有 20% 的人受到精神障碍的困扰。传统的研究方法在面对复杂的精神健康问题时,往往难以精准识别潜在风险因素和预测疾病发展。在此背景下,人工智能领域的机器学习技术为精神健康研究带来了新的曙光。
为了深入探究卢旺达青年的心理健康状况,挖掘潜在风险因素并进行有效预测,来自卢旺达大学非洲数据科学卓越中心(African Center of Excellence in Data Sciences, University of Rwanda)、卢旺达大学心理健康中心(Center for Mental Health, University of Rwanda)等多个机构的研究人员 Fauste Ndikumana、Josias Izabayo 等开展了一项极具意义的研究。该研究成果发表在《Scientific Reports》上,为全球精神健康研究提供了宝贵的参考。
研究人员采用了一系列先进的技术方法。数据来源于卢旺达生物医学中心(Rwanda Biomedical Center)在 2018 年进行的卢旺达心理健康横断面调查(RMHS 2018),选取了年龄在 15 - 24 岁的 5221 名青年作为研究样本。研究中使用 Mini - 国际神经精神访谈(MINI)7.0.2 版本确定常见精神障碍的发生情况,并评估创伤经历、重度饮酒等因素。在数据处理方面,运用 Python 3 进行数据清洗和预处理,基于生物 - 心理 - 社会理论框架筛选关键变量,对分类变量进行特征编码转换为数值格式。模型构建上,采用逻辑回归(Logistic regression)、支持向量机(Support Vector Machine,SVM)、随机森林(Random Forest)和梯度提升(Gradient boosting)四种机器学习算法,通过 70 - 30 的比例划分训练集和测试集,利用 10 折交叉验证训练模型,并运用网格搜索优化超参数,最终通过精度、召回率、F1 评分、准确率和受试者工作特征曲线下面积(AUC)等指标评估模型性能。
研究结果主要体现在以下几个方面:
- 心理健康患病率:研究发现,卢旺达青年中精神健康障碍的患病率为 14.48%。其中,重度抑郁发作最为常见,其次是惊恐障碍、强迫症等。大部分患者(67%)仅患有一种精神障碍,20% 的人患有两种精神障碍,13% 的人患有两种以上精神障碍。
- 相关因素分析:通过双变量分析发现,重度饮酒、创伤经历、离异或分居、暴力经历等与任何精神健康脆弱性显著相关;同时,有医疗状况史、有精神健康家族史、无宗教信仰、就业等也与精神健康相关。而加入亲社会群体与患至少一种精神健康障碍的可能性无关。
- 模型性能评估:在四种机器学习模型中,随机森林模型表现最佳,预测精神健康脆弱性时准确率达到 88.8%,AUC 为 83.59%;预测精神障碍共病时准确率为 75% ,AUC 为 0.738。其在精度、召回率和 F1 评分等指标上均优于其他模型,具有良好的区分能力,能有效区分有无精神障碍的个体。
- 关键风险因素确定:随机森林模型的特征重要性分析表明,创伤经历、暴力经历、重度饮酒、精神健康家族史、终身损失以及女性或年轻成年人身份与精神障碍的发生密切相关。在预测精神障碍共病时,创伤经历、暴力经历、加入亲社会群体、精神障碍家族史、终身损失、重度饮酒和先前的精神健康状况是关键因素。
在研究结论和讨论部分,该研究具有多方面的重要意义。一方面,研究证实了机器学习在预测卢旺达青年心理健康方面的巨大潜力,随机森林模型能够有效识别影响心理健康的关键因素,为早期干预和预防提供了有力的工具。另一方面,明确的风险因素为制定心理健康干预措施和政策指明了方向。在卢旺达制定相关政策时,应重点关注经历暴力和创伤事件的青年,加强对这些高风险群体的支持和干预。同时,该研究也存在一定的局限性,如使用的是横断面数据,无法反映心理健康状况的时间动态变化;分析仅涵盖社会和生物因素,遗漏了心理、认知等重要变量;模型的外部有效性和时间有效性可能受限;多类分类方法未考虑特定精神障碍的组合和共现模式以及病情严重程度。尽管如此,这项研究仍然为卢旺达乃至全球的青年心理健康研究和干预提供了重要的参考,激励后续研究在更全面、更深入的方向上探索,以更好地守护青年的心理健康。