
-
生物通官微
陪你抓住生命科技
跳动的脉搏
人工智能解析语音生物标志物:基于真实世界数据的自杀行为预测研究
【字体: 大 中 小 】 时间:2025年07月05日 来源:Scientific Reports 3.8
编辑推荐:
本研究针对自杀风险评估缺乏客观非侵入性工具的难题,创新性地利用人工智能(AI)分析公开网络语音数据,首次实现基于语音生物标志物(Voice biomarker)的真实自杀行为预测。通过机器学习(ML)和多层感知器(MLP)模型,研究团队在12个月内自杀案例中达到AUC 0.85的预测精度,为自杀预防提供了突破性的技术路径。
自杀作为全球重大公共卫生问题,其风险评估长期面临临床困境——传统问卷如PHQ-921存在显著局限性,约25%的自杀者在测试中显示"无自杀意念"。这种评估盲区催生了对客观生物标志物的迫切需求。语音分析因其非侵入性和丰富的情感信息成为研究热点,但既往研究多聚焦自杀意念或风险问卷评分,从未直接预测真实自杀行为。
德国PeakProfiling GmbH联合柏林夏里特医院等机构的研究团队,在《Scientific Reports》发表突破性成果。该研究首次利用公开网络语音数据(访谈、演讲等),构建包含180份录音(90例自杀者与匹配对照)的真实世界数据集,通过创新性特征工程和机器学习模型,实现了自杀行为的客观预测。
研究采用三大关键技术:1)基于傅里叶变换(Fourier transformation)提取2658项副语言特征,涵盖响度轮廓(Loudness)、基频(F0)和谐波特征;2)独创Bene特征降维法结合主成分分析(PCA);3)嵌套交叉验证(6-fold)框架下测试多层感知器(MLP)、XGBoost等算法性能。
分类模型
MLP模型在整体数据集中达到AUC 0.74,而在自杀前12个月的"近距组"(NearGroup)中性能显著提升至AUC 0.85,准确率76%。

特征重要性
Q+U Bene(量化与非结构化特征组合)表现最优,证实副语言特征组合的预测价值。相比开源工具openSMILE(AUC 0.62)和wav2vec2.0(AUC 0.54),自定义特征工程显著提升区分度。
时间敏感性
预测精度与录音-自杀时间间隔呈强负相关,印证语音生物标志物的动态演变特性,为"预警窗口期"概念提供实证支持。
这项研究标志着自杀预防研究的范式转变:首次跨越理论与实践的鸿沟,直接预测自杀行为而非替代指标。其创新性体现在三方面:1)利用自然场景语音突破临床数据局限;2)开发可解释的声学特征体系;3)验证AI模型在真实世界中的鲁棒性。
研究同时揭示重要临床启示:语音变化可能是自杀行为的近端标志物,这对构建动态监测系统具有指导价值。正如作者强调,该技术应作为临床决策的辅助工具(而非替代),需在伦理框架下发展。未来方向包括整合多模态数据(语音+文本+数字表型)和Transformer模型,以及在心理急救热线中的实施验证。
这项由德国联邦颠覆性创新机构(SPRIND GmbH)资助的研究,为精神健康领域开辟了非侵入性客观评估的新纪元,其方法论框架对抑郁症等精神障碍的早期识别同样具有借鉴意义。
生物通微信公众号
知名企业招聘