
-
生物通官微
陪你抓住生命科技
跳动的脉搏
声带振动动力学的标准化时空表征:喉振动图在嗓音障碍诊断中的革新应用
【字体: 大 中 小 】 时间:2025年05月13日 来源:Scientific Reports 3.8
编辑推荐:
本研究针对传统声门图(PVG)仅分析声门开放区域而忽略声带组织完整振动的局限性,创新性提出喉振动图(LVG)技术。通过深度学习分割声带组织并定义个体振动轴,实现了声带全长的标准化振动分析。结果表明LVG在健康人群中稳定性更高(RND变异减少),对病理组(如声带麻痹、息肉)的区分效应更强(效应量提升58%),且能精准量化非稳态发声(如发声起始期)的声带角度变化(γ=-61.07°/s至-85.35°/s)。该技术为嗓音疾病的客观诊断和治疗随访提供了新范式。
嗓音是人类沟通的核心工具,但约30%的成年人会经历嗓音障碍,其中7.6%存在持续性发声问题。传统诊断依赖喉高速视频内窥镜(HSV)记录声带振动,但每秒4000帧的数据量使人工分析难以临床常规化。更关键的是,现有声门图(Phonovibrogram, PVG)仅通过声门轮廓推导振动,存在两大缺陷:无法反映声带全长振动范围(如声带息肉导致的闭合不全区域),且依赖单一对称轴(忽略病理状态下的个体振动轴差异)。这些限制阻碍了跨研究和纵向比较的可靠性。
为解决这一难题,德国特里尔应用技术大学、萨尔大学医学中心等机构的研究团队开发了喉振动图(Laryngovibrogram, LVG)。该技术通过U-LSTM神经网络(结合卷积与长短期记忆单元)同步分割声门和声带组织,首次实现声带振动的全长标准化分析。研究纳入73例HSV记录(健康38例,病理35例),发现LVG较PVG具有三大突破:健康者振动幅度更稳定(RND变异系数降低),病理组区分效应更强(如声带息肉组RND降至2.13±1.20%),并能动态追踪非稳态发声的声带角度变化(如硬起音角速度γ=-85.35°/s)。
关键技术包括:1)基于U-LSTM的双向时空分割网络(处理4,000 fps的256×256 px HSV序列);2)振动轴动态插值算法(滑动窗口150帧);3)声带偏转归一化模型(δr,l=dr,l/Lr,l);4)多参数量化体系(如相对归一化偏转RND、相位差ΔΘ)。
研究结果揭示:
结论指出,LVG通过三项革新推动领域发展:
这项发表于《Scientific Reports》的研究标志着嗓音分析从"声门观测"到"声带动力学全景解析"的范式转变。未来,LVG或可整合入临床决策系统,通过自动化分类(如效应量提升58%)优化手术随访和康复评估。团队公开了代码和数据集(Zenodo: 10.5281/zenodo.15263300),为领域发展奠定基础。
生物通微信公众号
知名企业招聘