基于图卷积网络(GCN)的多特征融合语音抑郁检测新方法

首页今日动态人才市场新技术专栏中国科学人云展台
BioHot
云讲堂直播会展中心特价专栏技术快讯免费试用

生物通官微
陪你抓住生命科技
跳动的脉搏

生物通首页 > 今日动态 > 正文

【字体：大中小】 时间：2025年07月31日 来源：Annals of the New York Academy of Sciences 4.8

编辑推荐：

　　来自上海交通大学的研究人员针对语音抑郁检测中特征提取与分类的可靠性问题，开发了SJTU-LWDLab DACD音频特征集，创新性地采用图卷积网络(GCN)进行多特征结构化融合，有效解决了空间特征丢失导致的分类偏差，实验显示抑郁语音识别准确率达92.4%，为抑郁症辅助诊断提供了客观指标。

抑郁症作为全球高发的精神障碍，其早期筛查对防治至关重要。当前基于语音的计算机辅助检测方法虽便捷高效，但如何从声学特征中精准识别抑郁状态仍存挑战。上海交通大学团队构建了名为SJTU-LWDLab DACD的创新性音频特征集，通过图卷积网络(Graph Convolutional Network, GCN)对多维声学特征进行空间结构化融合，巧妙解决了传统方法中高度、深度等空间信息丢失导致的分类误差。实验数据表明，该模型对抑郁语音的识别准确率突破92.4%，不仅为精神健康评估提供了可量化的客观指标，更开创了多模态特征与图神经网络结合的新范式。研究者特别声明本成果不存在利益冲突，相关技术路线已通过图形摘要直观展示，凸显了人工智能技术在心理健康领域的转化应用潜力。

热点排行

新闻专题

联系信箱：

粤ICP备09063491号