基于深度学习的多模态特征融合个性化压力检测新方法:DSC-ResNet模型与CFFO优化算法

【字体: 时间:2025年08月22日 来源:Scientific Reports 3.9

编辑推荐:

  本研究针对社交媒体文本中压力检测存在的标注数据稀缺、计算复杂度高和语境模糊等关键问题,开发了集成FastText、Glove、DeepMoji和XLNet的多模态特征提取方法,结合深度可分离残差网络(DSC-ResNet)和混沌狐优化算法(CFFO)。实验显示该模型准确率达98.42%,F1-score达98.38%,显著优于传统CNN、BiLSTM等模型,为心理健康监测提供了高效解决方案。

  

在当代社会,压力已成为影响公众健康的隐形杀手。世界卫生组织数据显示,全球约2.8亿人受抑郁症困扰,而社交媒体正成为人们宣泄情绪的重要窗口。Twitter平台每天产生5亿条推文,其中蕴含大量反映用户心理状态的非结构化文本数据。然而,现有压力检测技术面临三大困境:短文本的语义模糊性使传统模型难以捕捉"我好像要撑不下去了"这类隐晦表达;标注数据匮乏导致模型泛化能力受限;复杂的深度学习架构在实时检测场景中面临计算资源瓶颈。

为突破这些限制,Ulligaddala Srinivasarao团队在《Scientific Reports》发表研究,创新性地将四种特征表示方法与轻量化网络相结合。研究人员首先构建包含17,802条标注推文的数据集(70%训练集,30%测试集),通过加权融合机制整合FastText(捕捉子词信息)、Glove(全局语义关系)、DeepMoji(表情符号情感)和XLNet(上下文依赖)的特征向量。核心创新点DSC-ResNet模型通过深度可分离卷积(DSCNN)降低75%计算量,配合残差连接解决梯度消失问题。混沌狐优化算法(CFFO)则通过模拟狐狸捕食行为的双阶段搜索策略,将超参数调优时间缩短至0.96秒。

数据预处理

研究采用四级文本清洗流程:符号化处理将"#Stress"分解为独立标记;去除@提及等社交符号;波特词干化将"feeling"统一为"feel";过滤"the"等停用词。这种处理使后续特征提取的噪声降低38.7%。

多模态特征提取

实验显示,FastText对罕见词(如自创词"exhausteddd")的识别准确率比Word2Vec高22%;Glove在"work-pressure"等复合词相似度计算中Pearson系数达0.89;DeepMoji通过注意力机制(Attention)捕捉到"笑着哭"表情的隐含压力信号;XLNet的排列语言模型(PLM)则有效解析了"没有明天"等倒装句的语义。

模型架构创新

DSC-ResNet在ResNet50基础上引入深度可分离卷积层,使3×3卷积的计算量从h2·zin·zout降至(h2+zout)·zin。测试表明,该设计在保持98.12%召回率的同时,将推理速度提升至传统CNN的8倍。

优化算法突破

CFFO算法采用帐篷混沌映射(Tent Chaotic map)替代随机初始化,其开发阶段通过式(14)-(16)模拟狐狸挖掘动作进行局部搜索,探索阶段则通过式(17)-(19)实现全局逃逸策略。在迭代100次后,模型损失函数收敛速度比遗传算法快3.2倍。

性能验证

在包含8901条推文的测试集上,模型展现出卓越的鲁棒性:对"想结束一切"等明确表述的检测准确率达99.4%,对"周末加班真好"等反讽语句的识别F1-score为97.1%。特别值得注意的是,在SWDD大型抑郁数据集的外部验证中,模型仍保持89.43%的精确度,证明其良好的泛化能力。

这项研究的意义在于三方面突破:方法学上首次将深度可分离卷积引入心理健康领域,为移动端部署提供可能;临床上建立的多模态特征体系能捕捉文字中细微的情感波动;社会应用层面开发的实时检测系统(MAE仅0.63)可为心理危机干预争取黄金时间。未来研究可探索图神经网络(GNN)建模用户社交关系,或结合可解释AI技术(如SHAP)增强模型透明度。正如作者强调:"这项技术不是要替代专业诊断,而是为早期筛查提供数字化哨兵。"

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号