编辑推荐:
这篇综述聚焦听觉研究中关于耳朵 “非凡” 特性的诸多观点。文中探讨了如鼓膜位移、耳的血管化程度等常见论断,剖析其合理性,旨在揭示耳朵功能的独特之处,帮助读者深入理解听觉科学,对相关领域研究有重要参考价值。
引言
声音在日常生活中无处不在,听力研究与大众生活紧密相连。从清晨聆听鸟鸣,到在音乐厅欣赏音乐会,再到与朋友闲聊,听力为人们提供了与世界交流和感知的途径。哺乳动物的耳蜗作为生物声音探测器,展现出许多从生物物理学角度令人惊叹的特性。例如,听力在空间维度上跨度极大,从鼓膜在听觉阈值处的10?12m 位移,到热噪声对毛细胞束的10?9m 扰动,再到耳蜗约10?2m 的长度,相关结构和现象的长度尺度跨越了 16 个数量级。然而,这些维度之间的直接比较并不明确,如鼓膜对损伤性声音的位移与毛细胞宽度就难以直接对比,而鼓膜在损伤性声音和听觉阈值下的位移之比可定义动态范围,这是一个在工程学中有用的指标。研究人员对耳朵相较于物理和工程学极限所展现出的 “非凡” 特性尤为关注,例如内耳被认为是进化中微型化的成功范例,在漫长的自然选择压力下,耳朵进化出多种形式,突破了物理限制。本文旨在探讨关于耳朵 “非凡” 特性的各种观点,分析其背后的科学依据,帮助人们更好地理解自然选择的奇妙产物,以及这些产物的行为为何会基于工程经验和物理科学而令人惊讶。
关于耳朵非凡性的论断
在研究论文、正式报告甚至学术会议的交流中,有许多关于耳朵的常见论断。这些论断涵盖多个方面,从解剖结构到功能特性,不同论断的可靠性和争议程度各异。
- (A)鼓膜在听觉阈值处的位移为10?12m:通过激光多普勒振动测量法(LDV)检测发现,在阈值时,人类鼓膜(鼓膜,TyM)的移动约为 1 皮米(pm,即10?12m) 。相比之下,氢原子的直径为 100 pm,是其 100 倍。从能量角度估算,人耳在阈值处接收到的能量约为10?17J(约2000kBT),与视觉检测所需的入射光子能量相当 。不同动物物种的阈值位移有所不同,如沙鼠在 10 kHz 刺激、80 dB SPL 时,鼓膜脐部振幅约为 1 nm,外推至听觉阈值时约为 0.1 pm;壁虎在 1 kHz、100 dB SPL 时,鼓膜位移为 1 μm,外推至 0 dB SPL 时为 10 pm。
- (B)耳朵被包裹在人体最坚硬的骨头中:内耳部分被颞骨的岩部(也称为耳囊)包裹,岩部名称源于拉丁语,有 “岩石般坚硬” 之意。其密度较高,这可能对保护内耳免受冲击和影响骨传导的声音传播有作用。但颞骨密度并不均匀,其乳突部分有稀疏区域。从临床角度看,这种密度差异有利于手术操作,如人工耳蜗植入手术。虽然有观点认为颞骨密度可能是人体最高的,但牙齿等结构也被认为是坚硬的,且其矿物密度值高于部分皮质骨,目前尚不清楚颞骨是否处于皮质骨密度范围的上限。
- (C)耳朵包含人体最小的骨头:人体解剖学教科书通常将听小骨(砧骨、锤骨和镫骨)描述为相对较小,甚至是人体 “最小” 的骨头,镫骨还常被认为是人体最小的横纹肌和骨骼肌附着的骨头。在人类的 200 块骨头中,听小骨在出生时就已完全形成和骨化,其中镫骨的最大长度最短,其足板面积约为3.5mm2,高度为 2.9 mm,质量为 2.2 - 4mg,这些数据支持了镫骨是人体最小骨头的观点。然而,不同物种的听小骨差异很大,鸟类和爬行动物只有一块听小骨,大象等陆地哺乳动物的听小骨较大,用于改善对地面振动的检测,因此该论断在其他物种中可能不成立。
- (D)耳朵包含人体血管化程度最高的组织:从能量角度看,耳蜗产生中阶(SM)的大静息电位需要能量,高血管化有助于维持相关代谢过程,为耳蜗放大提供能量。内耳有两条主要的血液供应途径,分别来自颈动脉和小脑动脉分支。虽然螺旋韧带(stria vascularis)被认为血管浓度较高,但目前尚未对其血管化程度进行量化。从耳蜗的相对尺寸估算,其含血量相对较少,但近期对小鼠的研究表明,螺旋韧带内血管分支程度高,相对上皮表面积大,这支持了耳蜗高度血管化的观点,但不能确定其是否是人体血管化程度最高的组织。
- (E)耳朵具有人体最高的静息电位:将考虑范围限定为单个细胞膜的静息电位,不考虑活动驱动的变化(如动作电位)。耳蜗毛细胞的细胞内电位相对于地电位约为 - 60 mV,而螺旋韧带主动泵出钾离子(K+),产生了内淋巴电位(EP),使中阶内淋巴相对于前庭阶和鼓阶的外淋巴具有 +80 mV 的电位,从而使毛细胞顶端表面的跨膜静息电位达到约 130 - 170 mV。与身体其他部位的电可兴奋细胞相比,虽然神经动作电位和心肌细胞的电位可超过 140 mV,但这些是瞬态的去极化和复极化,而 EP 相对稳定。耳蜗独特的内淋巴环境使其能产生较大的跨膜静息电位,这可能是人体最大的静息膜电位。
- (F)耳朵是人体最快的部分:“快” 是一个相对概念,将耳朵与其他感觉系统相比,嗅觉的速度约为 10 - 100 ms,视觉中视紫红质异构化极快(飞秒级),但人耳对振荡刺激的响应周期为 0.01 - 10 ms,比嗅觉快,在某些方面也比视觉快。耳朵能编码高达 1 - 100 kHz 甚至更高频率的机械振荡,这部分归因于一种名为 prestin 的运动蛋白,它能直接将电压转换为力。此外,耳朵还能在高达数 kHz 的频率下逐周期编码信号(相位锁定),这对声音定位和时间与位置编码等功能至关重要。例如,谷仓猫头鹰能将这一极限提高到 10 kHz 以上。耳朵在速度方面的非凡之处在于它突破了生物物理的 “速度限制”,尽管细胞膜的电阻 - 电容(RC)时间常数和神经递质的胞吐作用会影响高频信号的编码,但耳蜗似乎找到了在 10 kHz 以上仍能进行逐周期放大的方法。
- (G)耳朵能检测到热噪声以下的信号:耳朵作为生物探测器,在接近阈值时本质上更具概率性而非确定性。噪声在耳朵内以多种形式存在,如毛细胞束的热波动和机械 - 电转导(MET)通道的随机门控。耳朵通过时间整合和作为一个主动非线性系统来处理噪声中的信号检测。有观点认为布朗运动为 MET 检测弱信号提供了最佳噪声水平,但目前尚未达成广泛共识。Bialek 提出耳朵的响应阈值比热噪声低约一个数量级,其基于能量的论点围绕毛细胞束在阈值刺激下的运动与热噪声的比较,但该论点存在一些问题,如体内哺乳动物耳蜗中噪声驱动的毛细胞束运动幅度未知,耳朵是一个复杂的协同系统,基于单个毛细胞束运动的论点可能具有误导性。
- (H)耳朵能适应入射声能的巨大动态范围:听觉的动态范围指从听觉阈值(“最软”)到容易造成损伤的声压级(“最响”)的跨度,通常听觉的动态范围在声压方面跨越 6 个以上数量级(0 - 120 dB SPL),在能量方面跨越 12 个以上数量级。例如,从一只老鼠的重力势能到五百万头大象的重力势能的跨度,或从一节 D 型碱性电池的能量(105J)到 2022 年汤加火山喷发释放的能量(1017J)的跨度,都可类比听觉的动态范围。相比之下,视觉的动态范围约为 8.5 个数量级。然而,耳朵并非能随时在如此宽的范围内工作,中耳肌肉反射和中枢听觉系统的传出调节会调节耳蜗功能,使内耳表现出非线性的 “压缩” 行为,将大动态范围的输入压缩为听觉神经和中枢神经系统较小的输出范围。
- (I)中枢神经系统(CNS)的输入范围比可听声级小得多:单根听觉神经纤维的可变放电率范围有限,从自发放电到饱和,这影响了向中枢神经系统的编码。不同研究表明,听觉神经纤维的动态范围在 20 - 60 dB 或 10 - 100:1 之间。由于每个内毛细胞由多条听觉神经纤维支配,且这些神经元的自发放电率不同,多种可变自发率的听觉神经纤维足以编码较大范围的声音。但毛细胞本身的动态范围也有限,部分原因是 MET 通道的 S 形特性。因此,需要在主动耳的背景下考虑毛细胞(以及 “耳朵”)的动态范围。
- (J)耳朵不仅能检测声音,还能发出声音:健康的耳朵能产生并(相干地)发出声音,这些声音称为耳声发射(OAEs)。自 1978 年发现以来,OAEs 在科学研究和临床应用中具有重要意义。OAEs 在动物界广泛存在,其存在被认为是耳朵中存在主动能量产生过程的证据,尤其是自发耳声发射(SOAEs),它可在没有外部声刺激的情况下存在,其统计特性与自持振荡一致,表明存在基于代谢的力产生和功率放大过程,OAEs 可能是这些过程的副产品。OAEs 的特性与听力感知指标相关,如阈值最小值和频率差异阈值,这表明感知重要现象与主动过程之间存在直接联系。
- (K)耳朵有内置放大器:耳朵的主动能量产生过程表明它有内置放大器。OAEs 的存在是这一观点的重要证据,但直接在哺乳动物耳蜗中测量主动力产生具有挑战性且存在争议。除了耳蜗的螺旋结构外,颞骨的硬度和内耳结构的脆弱性也增加了研究难度。尽管如此,许多研究支持耳朵的主动特性,只是目前仍未找到确定的耳蜗放大测量方法。
- (L)耳朵有独特的 “指纹”:外耳(耳廓形状)可作为一种生物识别标记,类似于面部识别。内耳可能具有独特的功能 “指纹”,即特定耳朵对某些频率的编码或感知方式不同。商业耳机公司 Nura 利用测量个体的声音诱发 OAEs 来实现个性化聆听。OAEs 的频谱幅度具有独特的峰谷模式,与阈值微观结构和 SOAE 活动模式密切相关。内耳功能模型中的 “粗糙度” 假设可能是形成这种指纹的原因之一,具体的形态和生理机制仍有待研究。在一些非哺乳动物(如蜥蜴)中,双耳之间的声学耦合可使两只耳朵有效同步,因此 “指纹” 可能不仅属于单个耳朵,还可能与整个听觉外周相关。
- (M)耳蜗波在听力中起关键作用:自 Bekesy 发现耳蜗行波并获得 1961 年诺贝尔生理学或医学奖以来,关于这些波在听觉转导中的具体作用一直存在激烈争论。生理数据明确表明,哺乳动物耳蜗中存在多种波状行为,在一些看似不存在基底膜行波的耳朵(如蜥蜴和青蛙的耳朵)中也可能存在类似波的行为,这表明这些波可能对不同物种的听力具有适应性。一种被广泛接受的耳蜗力学理论认为,“相干散射” 是关键的生物力学原理,它使集体力产生能够有效地聚焦以发挥功能优势,这对比较研究和进化研究具有重要意义。
- (N)耳朵处于不稳定的边缘:SOAE 活动的存在表明耳朵可能处于不稳定状态,类似于麦克风 / 扬声器设置中的声学反馈。然而,内耳是一个非线性、嘈杂、非平衡的系统,确定其稳定性的参考点并不明确。以简单的机械类比,一个在山坡上的球,在山谷中的平衡点是稳定的,而在山顶上的平衡点是不稳定的。对于主动非线性振荡器(如范德波尔系统),当控制参数 μ 从 0 变为正值时,系统会经历超临界霍普夫分岔,表现为极限环振荡,这种行为在传统意义上不稳定,但极限环行为是可靠且可预测的。关于内耳放大的产生机制存在两种不同观点,一种认为内耳可被视为 “临界振荡器阵列”,毛细胞处于霍普夫分岔点,耳朵处于不稳定边缘;另一种观点认为耳朵是一个分布式系统,各部分协同工作,耳蜗本质上是稳定的,因为一个位置产生的主动能量可在其他地方消散。目前,关于内耳中产生 SOAE 的自发振荡以及各运动部分之间的相位关系的实证证据很少,因此与该论断相关的争论可能会持续。
- (O)耳朵是高度非线性的:从保存外部声学信号信息的角度看,耳朵似乎应尽可能线性以保持高保真度。但生理和功能研究表明,非线性效应在听力中起着重要作用。例如,毛细胞 MET 在束位移和转导电流之间存在 S 形关系,这使得毛细胞的 MET 本质上是非线性的,外毛细胞电容等其他生理方面也表现出非线性行为。这些非线性会导致声音失真,如能感知到微弱的 Tartini 音(听觉错觉),且健康耳朵会产生畸变产物耳声发射(DPOAE),这是线性耳朵不会产生的。然而,耳朵在执行类似傅里叶分析的功能时,虽然存在非线性现象,但也具有与线性系统一致的功能。因此,耳朵不应被认为是 “高度” 非线性的,它在保持保真度(线性)和实现有益特性(如压缩以增加动态范围,非线性)之间取得平衡。
- (P)耳朵非常脆弱:哺乳动物的内耳被包裹在坚硬的骨头中,这在一定程度上提供了保护,但也增加了研究内耳生理学的难度。听力损失(HL)的普遍存在表明耳朵容易受到损伤,常见的原因包括年龄相关的听力损失(老年性耳聋,presbycusis)、噪声暴露导致的听力损失(噪声性听力损失,NIHL)、药物和化学物质(如氨基糖苷类抗生素和化疗药物顺铂)的影响等。这些原因通常与毛细胞损失和耳蜗突触病变(“隐性听力损失”)相关。然而,一些耳朵可能比其他耳朵更具弹性,传出神经支配的差异可能影响耳朵对损伤的易感性。此外,非哺乳动物的毛细胞再生能力使其在遭受损伤后能够恢复听力,这表明从长期寿命和日常代谢需求来看,耳朵可能比人们普遍认为的更具韧性。
- (Q)人类听力表现出相对非凡的调谐锐度:耳朵的功能特性包括敏感性和选择性,频率选择性(调谐)指区分不同频率声音的能力,耳朵通过机械的音调拓扑映射实现调谐,不同频率对应于耳蜗(或内耳)不同的空间位置。长期以来,人们认为人类的频率选择性与其他哺乳动物相似,但通过耳声发射和修订的心理物理学方法研究发现,人类的频率选择性实际上相对更敏锐。然而,“非凡” 这一说法具有一定主观性,可能存在其他研究较少的动物,其在更宽频率范围内具有更敏锐的调谐。例如,大象和鲸类等大型哺乳动物的耳蜗较长,可能具有更多的音调拓扑 “空间”。此外,调谐锐度过高会牺牲时间分辨率,这是滤波器理论预测的频率选择性和时间分辨率之间的固有权衡,不同物种可能会根据自身情况在两者之间找到平衡,而人类目前的平衡是由哪些精确因素导致的仍有待研究。
总结
本文探讨了多个关于耳朵 “非凡” 特性的论断,这些论断虽然具有主观性,但对其深入研究为听觉科学的关键话题提供了丰富素材。许多论断相互关联,如耳朵的 “内置放大器” 与 “检测热噪声以下的信号” 和 “巨大的动态范围” 相关。从进化的角度看,不同生物的耳朵在形态和功能上存在广泛差异,进化压力促使耳朵形成了多种生物力学解决方案来实现听力功能,这与视觉系统既有相似之处又有明显区别。未来的研究将进一步揭示听觉过程的非凡之处,帮助人们更好地理解我们感知世界声音的奇妙过程。