综述:机器学习在焦虑检测中的应用:趋势、模型评估与未来方向
《Frontiers in Artificial Intelligence》:Machine learning approaches to anxiety detection: trends, model evaluation, and future directions
【字体:
大
中
小
】
时间:2025年10月22日
来源:Frontiers in Artificial Intelligence 4.7
编辑推荐:
这篇系统综述全面评估了机器学习(ML)在焦虑预测领域的最新进展,重点分析了算法性能、特征工程和验证方法。文章指出,虽然随机森林(RF)和梯度提升(GB)等集成方法在准确率(如高达98%)上表现突出,但现有研究普遍存在样本量小、泛化能力不足及“黑箱”模型可解释性差等局限。作者强调,未来研究需整合多模态数据(如EEG、ECG、EDA)并引入可解释人工智能(XAI)技术,以推动ML模型从症状识别向早期风险预测的范式转变,最终实现临床实用化。
焦虑作为一种普遍存在的心理健康问题,对个人福祉和社会生产力均构成严重威胁。随着数字环境的普及,青少年焦虑问题日益凸显,亟需开发先进的预测工具以实现早期干预。机器学习(ML)在该领域展现出巨大潜力,但其在焦虑预测中的应用尚处于起步阶段,缺乏对方法学趋势和局限性的系统评估。
焦虑被定义为一种面向未来、持续时间较长的弥漫性威胁反应,与恐惧这种针对特定威胁的短期反应有所不同。研究表明,焦虑对个体自我感知健康和整体幸福感的影响与抑郁相当,且超过70%的自杀未遂者曾经历焦虑障碍。近年来,机器学习技术逐步应用于心理健康研究,通过分析行为模式、风险因素和干预路径,为焦虑障碍的预测和管理提供新视角。
本研究基于Scopus和Google Scholar数据库,检索2018年至2025年间发表的文献,最终纳入19项研究,涵盖44,608名参与者。最常用的焦虑评估工具为GAD-7和DASS-21量表。文献筛选采用两步法:首先验证关键词出现位置,其次通过标题、引言和结论判断研究主题是否符合ML焦虑预测的标准。
监督学习是焦虑预测的主流方法,常用算法包括支持向量机(SVM)、决策树、随机森林(RF)和梯度提升(GB)。其中,树模型因其可解释性备受临床场景青睐,而神经网络(ANN)则擅长处理多模态数据中的非线性关系。例如,多层感知器(MLP)在结合生理指标(如心率变异性)和问卷数据时表现优异。此外,模糊推理系统(FIS)和贝叶斯网络能模拟焦虑与睡眠、压力等变量的概率关系,增强模型的可解释性。研究显示,集成方法(如Stacking)通过融合多个基学习器的预测结果,可显著提升模型鲁棒性。
GAD-7和DASS-21是当前最常用的焦虑评估工具。GAD-7包含7个条目,总分0-21分,分数越高表明焦虑程度越严重;DASS-21则通过21个条目同步评估抑郁、焦虑和压力三个维度。这些量表为ML模型提供了标准化标注数据,但依赖自评报告可能引入主观偏差。
纳入研究的模型平均准确率为83.45%,但方差较大(88.49),反映性能波动显著。数据集存在明显局限性:样本多源于高校学生或特定地区人群,规模较小(平均约270人),且缺乏年龄、性别和社会经济状态的多样性。特征选择方法参差不齐,部分研究采用信息增益(Information Gain)或最小冗余最大相关(mRMR)算法优化输入,但多数未详细报告筛选流程。评估指标以准确率为主,而F1分数、AUC等更适合不平衡数据的指标使用不足。
当前研究的核心挑战在于模型泛化能力和临床适用性。一方面,小样本和同质化数据导致过拟合风险;另一方面,“黑箱”算法(如深度神经网络)阻碍了临床信任的建立。未来需重点探索多模态融合技术,例如整合语音、文本和生理信号(EEG/GSR)构建更全面的焦虑表征。同时,引入可解释AI(XAI)工具(如SHAP值)解析模型决策逻辑,是推动临床落地的关键。值得注意的是,现有工作集中于症状出现后的分类任务,而非症状发生前的风险预测,这一范式转变将为预防性干预开辟新路径。
机器学习在焦虑检测中已展示出显著潜力,尤其是集成学习和多模态方法表现突出。然而,要实现从“识别已发生焦虑”到“预测焦虑风险”的跨越,需解决数据多样性不足、模型可解释性差及验证标准缺失等问题。未来研究应聚焦于开发前瞻性预测模型,并在更广泛人群中验证其效能,最终为主动式心理健康支持系统奠定基础。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号