融合上下文与情感特征的深度学习模型CLSDepDet在社交媒体抑郁风险识别中的应用研究

【字体: 时间:2025年06月13日 来源:Expert Systems with Applications 7.5

编辑推荐:

  针对社交媒体抑郁检测中多特征融合不足的难题,Nha Tran团队开发了结合语言(Linguistic)、情感(Sentiment)和上下文(Context)特征的混合模型CLSDepDet。该模型通过LSTM捕捉时序特征,HCAN提取层级上下文信息,在Reddit数据集上实现93%准确率和95% F1值,为心理健康早期筛查提供了新范式。

  

社交媒体已成为现代人情感表达的重要窗口,而抑郁症作为全球3.8%人口面临的健康威胁,其早期识别对降低自杀风险至关重要。世界卫生组织数据显示,COVID-19大流行导致抑郁症发病率激增28%,但传统检测方法难以捕捉社交媒体中隐含的抑郁信号。现有技术面临三大瓶颈:非结构化文本处理困难、语言特征与情感线索割裂、上下文时序依赖建模不足。

为突破这些限制,研究人员开发了CLSDepDet混合模型。该研究创新性地融合语言学特征(LIWC词库分析、POS词性标注)、情感特征(VAD三维度分析)与深度上下文表征,通过双通道架构实现多模态特征协同。核心技术创新在于:1)采用分层上下文注意力网络(HCAN)捕捉词/句级语义关联;2)引入TopSBM主题建模增强内容解析;3)构建LSTM-HCAN联合框架处理时序依赖。实验采用Reddit平台1841条标注数据(抑郁/非抑郁帖文占比1:2.4),经文本标准化、停用词过滤等预处理后,模型显著超越基线方法。

研究结果部分揭示:

  1. 数据准备:清洗后的Reddit数据集显示抑郁用户更频繁使用第一人称单数代词和负面词汇,验证了语言学标记的鉴别价值。
  2. 混合模型架构:HCAN模块对"hopelessness"等关键词的注意力权重达0.87,较传统CNN提升32%;LSTM层成功捕获"exhausted→can't sleep→suicidal"等情感递进模式。
  3. 性能验证:在测试集上达到93%准确率,精确率/召回率分别达94%和96%,F1
    -score(95%)较纯LSTM模型提升11.8%。

结论部分强调,CLSDepDet首次实现三大突破:1)证明多特征融合对抑郁检测的协同增益效应;2)构建可解释的层级注意力机制;3)为实时监测系统提供轻量化方案。该成果发表于《Expert Systems with Applications》,其技术框架可扩展至焦虑症等心理健康领域,对打破诊疗资源壁垒具有重要实践意义。研究同时指出,未来需在跨文化语料验证和隐私保护方面深入探索。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号