基于图卷积神经网络(GCN)的多模态融合抑郁症检测新方法

【字体: 时间:2025年07月14日 来源:International Journal of Imaging Systems and Technology 2.5

编辑推荐:

  为解决抑郁症临床诊断难题,研究人员创新性地提出融合文本、音频和视觉数据的多模态检测模型。该研究采用BERT和Bi-LSTM提取文本特征,结合深度图卷积神经网络(GCN)实现跨模态特征融合,在DAIC-WOZ数据集上取得96.30%的F1值,显著优于现有技术,为精神疾病客观诊断提供新范式。

  

抑郁症作为困扰全球3.5亿人的重大精神障碍,其精准检测面临巨大挑战。这项研究突破性地构建了基于图卷积神经网络(Graph Convolutional Network, GCN)的多模态融合框架,巧妙整合文本(BERT+Bi-LSTM)、音频(Bi-LSTM)和视觉(Bi-LSTM)三维特征。通过深度GCN架构实现跨模态特征交互与增强,模型能有效捕捉抑郁相关生物行为标记。在标准数据集DAIC-WOZ上的测试表明,该方案以96.30%的F11-score刷新性能纪录,较传统单模态方法提升显著。特别值得注意的是,该方法首次实现语言韵律(音频)、微表情(视觉)与语义特征(文本)的图结构融合,为建立客观量化诊断标准提供重要技术支撑。研究者特别声明本成果无利益冲突,确保学术公正性。

相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号