声带振动动力学的标准化时空表征:喉振动图在嗓音障碍诊断中的革新应用

【字体: 时间:2025年05月13日 来源:Scientific Reports 3.8

编辑推荐:

  本研究针对传统声门图(PVG)仅分析声门开放区域而忽略声带组织完整振动的局限性,创新性提出喉振动图(LVG)技术。通过深度学习分割声带组织并定义个体振动轴,实现了声带全长的标准化振动分析。结果表明LVG在健康人群中稳定性更高(RND变异减少),对病理组(如声带麻痹、息肉)的区分效应更强(效应量提升58%),且能精准量化非稳态发声(如发声起始期)的声带角度变化(γ=-61.07°/s至-85.35°/s)。该技术为嗓音疾病的客观诊断和治疗随访提供了新范式。

  

嗓音是人类沟通的核心工具,但约30%的成年人会经历嗓音障碍,其中7.6%存在持续性发声问题。传统诊断依赖喉高速视频内窥镜(HSV)记录声带振动,但每秒4000帧的数据量使人工分析难以临床常规化。更关键的是,现有声门图(Phonovibrogram, PVG)仅通过声门轮廓推导振动,存在两大缺陷:无法反映声带全长振动范围(如声带息肉导致的闭合不全区域),且依赖单一对称轴(忽略病理状态下的个体振动轴差异)。这些限制阻碍了跨研究和纵向比较的可靠性。

为解决这一难题,德国特里尔应用技术大学、萨尔大学医学中心等机构的研究团队开发了喉振动图(Laryngovibrogram, LVG)。该技术通过U-LSTM神经网络(结合卷积与长短期记忆单元)同步分割声门和声带组织,首次实现声带振动的全长标准化分析。研究纳入73例HSV记录(健康38例,病理35例),发现LVG较PVG具有三大突破:健康者振动幅度更稳定(RND变异系数降低),病理组区分效应更强(如声带息肉组RND降至2.13±1.20%),并能动态追踪非稳态发声的声带角度变化(如硬起音角速度γ=-85.35°/s)。

关键技术包括:1)基于U-LSTM的双向时空分割网络(处理4,000 fps的256×256 px HSV序列);2)振动轴动态插值算法(滑动窗口150帧);3)声带偏转归一化模型(δr,l=dr,l/Lr,l);4)多参数量化体系(如相对归一化偏转RND、相位差ΔΘ)。

研究结果揭示:

  1. PVG与LVG对比:以25岁男性声带息肉为例,PVG漏诊了占声带25%的息肉(位于右声带63%处),而LVG清晰显示其对侧声带的静态压痕(振幅-1.2%)。
  2. 健康者重复测量:同一受试者3次发声的LVG振动模式高度一致(RNDr=5.88-8.69%),但硬起音导致相位差增大至0.43 rad(开放区仅0.23 rad)。
  3. 临床组差异:声带麻痹组的振动对称性(QRND=0.60±0.26)显著低于健康组(0.86±0.07),而息肉组的时间稳定性更差(jitter=27.50%)。
  4. 非稳态发声分析:LVG首次实现声带角度Γ(t)的自动追踪,发现硬起音的闭合速度比正常起音快40%。

结论指出,LVG通过三项革新推动领域发展:

  • 空间维度:将分析范围从声门区扩展到声带全长,识别出传统方法遗漏的病变(如声带闭合区的息肉)。
  • 标准化体系:通过长度归一化(Lr,l)实现跨研究可比性,健康者RND变异减少21%。
  • 动态捕捉:量化非稳态过程的声带运动(如角速度γ),为痉挛性发声障碍等疾病提供新指标。

这项发表于《Scientific Reports》的研究标志着嗓音分析从"声门观测"到"声带动力学全景解析"的范式转变。未来,LVG或可整合入临床决策系统,通过自动化分类(如效应量提升58%)优化手术随访和康复评估。团队公开了代码和数据集(Zenodo: 10.5281/zenodo.15263300),为领域发展奠定基础。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号