听觉通路中神经响应可靠性作为神经编码转换的标志物:从外周冗余时间编码到皮层分布式发放率编码的渐进转变

【字体: 时间:2025年09月20日 来源:Advanced Science 14.1

编辑推荐:

  本研究通过解码随机声音流,结合听觉神经生物物理模型与小鼠清醒状态下下丘(IC)、听觉丘脑(MGB)和听觉皮层(A1)的大规模记录,系统揭示了神经编码沿听觉通路的渐进转变:单个神经元的时空编码可靠性逐渐降低,发放率编码(rate code)逐渐占主导;皮层神经活动呈现协同性(synergy),而皮下区域更冗余;神经沉默(neural silence)与发放组合在神经元对中高效编码信息。这些发现表明神经编码从外周个体化、冗余的时间编码向皮层分布式发放率编码的转变。

  

引言

声音感知在自然声学环境中受多种因素影响,如发射器和接收器的位置与运动、声音传播干扰物及竞争声源的存在。神经响应还取决于反映瞬时大脑状态的内部因素,如注意力和响应准备度。尽管存在这些潜在干扰因素,听觉系统仍能可靠识别声学物体或感知。神经编码的关键属性之一是必须有效区分不同输入,另一关键特性是可靠性(reliability)——即在给定输入存在噪声或失真变异时保持一致响应的能力。也就是说,可靠的神经编码中,相似刺激应引发相似编码。然而,这一假设尚未被证实,且神经编码在声音发射的现实和挑战性条件下对声学失真的抵抗程度仍属未知。

时间 firing patterns(精确计时的 spike 序列)和 firing rates(spike 数量)被认为是听觉系统等多种感觉系统中神经编码的主要组成部分。这些时空和发放率编码所传递的信息通常基于其刺激区分能力进行评估,这 critically 取决于神经响应的 trial-to-trial 一致性。这种一致性或变异性源于内在突触噪声和大脑状态波动,因此仅考虑了神经空间的变异。然而,这些时空和发放率编码对声学刺激空间变异的稳健性——如声源位置变化、回声或阴影存在、发射器特性变化——仍不清楚。换言之,尚不知这些编码在外源性因素改变刺激时是否保持可靠。

此外,这些编码的可靠性是否沿中枢听觉通路发生变化亦属未知,这可能为神经编码的渐进转变提供证据。一个长期假设认为,随着听觉信息沿通路上传,存在从时间编码向发放率编码的转变。该假设得到研究的支持,这些研究显示精细时间编码和 trial-to-trial 可靠性沿听觉层级逐渐退化, likely due to 神经元的生物物理特性和从一处理阶段到下一阶段的汇聚输入的时间整合。然而,这一观点受到在听觉皮层许多神经元中存在精确时间编码的发现的挑战,这对于 coincident spiking 至关重要——一种被认为 underlie 皮层中基于 ensemble 的信息编码的机制。这些看似矛盾的结果可能源于单神经元水平与群体水平神经编码可靠性的 discrepancy。虽然理论工作强调了皮层群体编码的效率,但大多数实证研究仅关注听觉皮层,很少尝试比较听觉通路不同阶段的群体编码或系统对比单神经元与群体水平编码。

结果

2.1 神经编码可靠性算法用于评估单个神经元和神经元组的解码能力

研究者开发了一种评估神经编码可靠性(neural coding reliability, NCR)的算法,其原理是:可靠的神经编码中,相似刺激应引发相似编码。在此假设下,引发给定神经响应的刺激应能通过平均触发最相似响应的100个刺激来良好预测。该算法是一种 reverse-correlation 方法, applied not to a single spike, but to spiking patterns with a similar temporal firing pattern,扩展了 STRFs 的概念,使其本质上非线性。算法仅依赖两个参数:包含 spiking pattern 的时间窗口(此处为100 ms)和用于定义“相似” spiking patterns 的 spike trains 之间的距离。通过简单改变算法中的 spike trains 距离,可以计算和比较不同神经编码。研究者比较了基于卷积 spike trains(bin 0.5 ms,Hann 窗口长度9 ms)欧氏距离的时间编码和基于100 ms时间窗口内 spike count 的发放率编码。

NCR 度量定义为 NCR = Log10(|Corr|[S;N]),其中 |Corr|[S;N] 是预测刺激与原始刺激 S 之间的 Pearson 相关系数的绝对值。该度量不依赖于神经元的 FR,可轻松应用于任何研究的听觉区域;相关性是量化估计刺激与实际刺激匹配程度的计算有效度量;绝对值解释了负或正相关中的同等信息;对数变换减少了 |Corr| 分布的强偏态性;当 S 和 N 遵循双变量正态分布时,NCR 在维度上等同于互信息。NCR 具有近似低偏态对数正态分布。

该算法还可用于估计一组神经元的解码能力,通过考虑这些神经元的串联 spike trains 之间的距离。例如,两个神经元的预测比单个神经元的预测更接近实际刺激,且 NCR 更高。

使用泊松随机 spike trains 的 NCR 计算,研究者为时空和发放率编码建立了显著性阈值 -2.12。从刺激到 spike train 最大化 NCR 的时间滞后与听觉通路的经典生物时间滞后一致:从 AN 的1-2 ms 增加到 A1 的10-25 ms。有趣的是,对于高 NCR 值,在 AN、IC 和 MGB 中,时空和发放率编码最大化 NCR 的时间窗口大小通常相似,但在 A1 中 qualitatively 不同,发放率编码的时间窗口(200 ms)远长于时间编码(24-48 ms)。这一结果表明,至少在 A1,发放率编码需要长时间窗口的 spike 时间整合以获得良好的解码性能。在后续分析中,研究者选择对所有区域使用100 ms时间窗口,以允许听觉区域间的 NCR 比较,因为在此值下,NCR 在所研究区域和编码中大多达到峰值或平台期。

2.2 神经解码特性沿听觉通路逐渐改变

研究发现,NCR 沿听觉通路层次性降低,对于时空和发放率编码均如此。这种下降在 multi- 和 single units 中均明显。编码间 NCR 值比较显示,在 A1,发放率编码的解码性能优于时间编码。A1 中仅18%的神经元对发放率编码达到显著解码性能,而时间编码为49%。更 generally,单个神经元(和 multiunit)携带的最大信息量以及神经编码的本质沿听觉通路逐渐转变,从 AN 的时间编码转变为 A1 的发放率编码,在 multiunits 和 single units 中观察到相同趋势。这一转变与神经编码的内在编码能力一致。确实,从 IC 到 A1,NCR 值越高,时间编码相对于发放率编码的效率越高。相反,携带低水平信息的神经元对发放率编码更准确。在 A1,NCR 值低,因此平均而言,发放率编码对于刺激解码总是比时间编码更高效。这一从 timing 到发放率编码的转变在所有诱发 firing rates 下均被观察到,因此不能由 RDS 沿听觉通路诱发的 firing rate 降低来解释。

通过重建记录的 single units 的立体定位坐标,研究者还确定了 NCR 值是否存在层状梯度。A1 第 VI 层的 NCR 值显著高于第 III 和 V 层,MGB 腹侧和内侧部分的 NCR 值显著高于背侧部分。

2.3 更大的感受野增加神经编码可靠性

研究者从纯音刺激获得的频谱时域感受野(STRF)中提取了几个神经特性,包括自发或最大 firing rate、最佳频率(best frequency)、频率带宽、第一 spike 潜伏期和响应持续时间。对于时间编码,自发活动与 IC 和 MGB 中测量的 NCR 无关,但 NCR 随着 AN、IC、MGB 和 A1 中诱发的 firing rate 增加而增加,直至瞬时最大 firing rate 约200–300 sp s?1 或平均 firing rate 约20–30 sp s?1,随后在更高 firing rates 下降低。这些结果表明,时间编码的 NCR 对于更可兴奋的神经元更大,即使非常高的 firing rates 可能涉及非诱发 spike discharges 并降低神经响应的可靠性。NCR 随着 AN、MGB 和 A1 中的神经带宽增加而显著增加,但在 IC 中不显著,其在约两个倍频程处达到峰值。NCR 还随着所有区域中的峰值持续时间增加而增加。这些结果表明,通常,更大的感受野(在时间和频率维度上)与更可复制的 temporal firing patterns 相关。有趣的是,在 IC 和 MGB 中,具有较短潜伏期的神经元达到时间编码的更高 NCR 值,但这种效应在 AN 和 A1 中不显著。最后,在 IC 和 MGB 中,高频神经元(>16 kHz)的 NCR 值更高,但在 AN 和 A1 中不然。对于发放率编码获得了非常相似的结果。

2.4 刺激信息与神经元调谐之间的关系沿听觉通路逐渐减弱

在上述实验中,研究者隐含地认为神经响应位于显著 STRF 边界内,即其调谐频率范围内。然而,感觉神经元可能被位于其 STRF 边界外的复杂刺激兴奋。因此,研究者调查了这些边界外的神经解码可靠性。通常,在 AN 中,对于时空和发放率编码,STRF 内的 NCR 值更大,但在 IC 中不然。在 MGB 和 A1 中,甚至观察到相反的模式,对于两种编码,“调谐”频率范围内的 NCR 值低于其“下方”或“上方”。这一结果令人惊讶,因为在几个个体例子中,NCR 值的频率 profile 与神经元 firing pattern 紧密匹配。特别是,NCR 在神经元的最佳频率处达到峰值——神经元能产生最多 spikes 的频率。这种现象在 AN 中特别明显,与之前结果一致,并逐渐消失直至 A1,其中 NCR 的光谱 profile 不在最佳频率处峰值,而是偏向较低频率。值得注意的是,在 AN 中,对于时间编码,NCR 的频率 profile heavily 集中在神经元的最佳频率周围,而对于发放率编码,最高 NCR 值延伸至 STRF 的侧翼。这些结果表明,仅在听觉通路的早期阶段,神经元的最佳频率产生最可靠的 spiking patterns,并且平均而言,发放率编码的可靠性在丘脑皮层听觉系统中逐渐变得更独立于神经元的最佳频率。

2.5 快速发放细胞比规则发放细胞具有更好的解码能力

细胞外记录跨越兴奋性和抑制性神经元,抑制性神经元在 IC、MGB 和 A1 的 lemniscal 部分约占20–30%。在 A1,大多数 PV+ 细胞是快速发放(FS)细胞,具有短 spike 半宽和峰谷值。该区域的其他神经元通常被认为是规则发放(RS)细胞。在选择可以准确估计这两个参数的 spike waveforms 后,研究者在 A1 记录中观察到这些参数的双峰分布,根据此,他们将 A1 中具有最短8%值的‘2* spike 半宽 + 峰谷值’的细胞标记为 FS,这一百分比与 PV 细胞比例和 A1 中 FS 细胞的先前报告一致。FS 细胞更常见于第 II 和 III 层以及第 V 层上部。基于 PV 标记的 IC 中 FS 细胞的染色 profile 在先前研究中较不清晰,甚至 MGB 中这些细胞的存在受到质疑,尽管 MGB 腹侧区域有强烈的 PV 标记。尽管如此,FS 细胞可能决定功能不同的细胞亚型,如在 IC 中,因此研究者比较了三个研究区域中 FS 和 RS 细胞的 NCR 值。为此,研究者应用了与 A1 相同的百分比标准(8%)来标记 IC 和 MGB 中的 FS 细胞。发现 FS 细胞在 IC 和 MGB 中具有比 RS 细胞更高的 firing rates。随后观察到,在所有三个区域(IC、MGB 和 A1),FS 细胞对于两种编码策略都具有比 RS 细胞更高的 NCR 值。特别是,MGB 中 FS 和 RS 细胞之间的 NCR 量级差异大于其他区域,表明 FS 细胞可能 indeed 代表 MGB 中一种有趣的神经元亚型,就其对于复杂声音响应的高可靠性而言。

2.6 发放率促进听觉皮层神经元间的协同性

NCR 在个体神经元中沿听觉通路降低,无论考虑哪种编码。因此,大脑至少有两种方式维持全局信息量:i) 增加神经元数量,前提是该额外神经元群体携带的信息与已编码信息不完全冗余;ii) 使用更分布的编码而非依赖个体神经元,使得神经元群体携带的信息维持甚至增加相对于个体神经元提供信息的协同性。研究者通过计算神经元对1和2的 NCR1,2 来调查大脑使用的策略,以确定这两个神经元联合响应携带的信息。如最近关于信息部分分解的报告,对于一对神经元,关于刺激 S 的信息可以由每个神经元单独唯一提供,由两个神经元一起冗余提供,或由两个神经元一起协同提供。冗余在此上下文中定义为关于 S 的信息量,该信息可从两个神经元中的任一个获得。相反,协同是仅由两个神经元一起提供的信息,排除冗余信息和每个神经元单独提供的信息。将此类方案扩展到两个以上神经元 quickly 遇到组合问题。尽管如此,将信息部分分解为这种结构越来越受欢迎,因为它“意味着协同和冗余相互作用不再相互排斥”,解决了概念张力。将相同的推理思路应用于 S 的预测是诱人的,此处测量为 S 与重建刺激之间的相关性 |Corr|S;N1,N2,作为声音频率 f 的函数,如图2D右侧所示。然后,该相关性可以启发式地分解。

研究者考虑 |Corr|S;N1,N2的归一化版本,除以 Max(|Corr|S;N1,N2,|Corr|S;N1,|Corr|S;N2) 然后在 f 上平均。当 |Corr|S;N1> 0 且 |Corr|S;N2> 0 但 |Corr|S;N1,N2= 0 时(当考虑神经元对时信息完全丢失),该归一化协同达到 -100%;如果 |Corr|S;N1,N2= Max(|Corr|S;N1,|Corr|S;N2) 则等于0;如果 |Corr|S;N1= |Corr|S;N2= 0 且 |Corr|S;N1,N2> 0(信息仅在考虑神经元对时存在)则增加至100%。提供了一个个体例子,使用与图2D相同的两个神经元。当考虑时间编码携带的信息时,神经元对中的协同性很小(+12%),因为 |Corr|S;N1,N2≈ Max(|Corr|[S;N1],|Corr|S;N2)。对于发放率编码,协同性甚至为负(-41%),因为 |Corr|S;N1,N2远小于 |Corr|[S;N1] 和 |Corr|S;N2。相反,冗余性高,因为联合信息与两个个体神经元的重叠信息紧密匹配。AN 神经元对获得了类似的协同/冗余值,而来自 A1 的例子显示发放率编码的高度协同性(+44%)和时间编码无协同性(-7%)。

研究发现,对于发放率编码,神经元间的协同性从 AN 到 IC/MGB 然后从 IC/MGB 到 A1 显著增加,而对于时间编码,它沿听觉通路略微降低。有趣的是,在 AN 和 IC 中,时间编码的协同性更大,而在 MGB 和 especially A1 中,发放率编码的协同性更大。对于时间编码,冗余性在不同区域的变化没有清晰趋势,而对于发放率编码,冗余性从 AN 到 MGB 和 A1 降低,后两个区域之间无显著差异。例如,AN 中的神经元产生(弱)协同的 spiking patterns,但其 firing rates 高度冗余且协同性差。这一结果表明,AN 纤维的独立性——模拟中固有且生物学上真实,因为它们连接到不同的毛细胞——产生非常相似和可复制的 firing rates,但神经元间更可变的 temporal firing patterns。

有人提出,重叠的 STRFs 可能导致神经元间高水平的同步性,有助于神经元间解码信息的相似性。研究者探索了听觉感受野的重叠如何解释数据中观察到的不同区域的协同和冗余水平。与先前研究一致,发现神经元间的冗余性随着两个神经元最佳频率之间距离的增加而降低,无论何种编码。反直觉地,协同性也是如此,表明一定程度的 STRF 重叠对于提供超出神经元对中个体神经元单独携带信息的附加信息是有用的。显著地,协同性和冗余性在其他区域中较少依赖于最佳频率之间的距离。与图4D所示结果一致,研究者在此提供了额外证据,表明个体神经元和神经元组的解码性能沿听觉通路逐渐变得独立于神经元调谐。

2.7 神经元组装体帮助解码声音复杂性

研究者随后调查了神经元对间这种协同性的可能功能角色。一个共识是,在个体神经元水平上模糊的复杂声音特征可能通过增加神经表示的维度——即使用神经组装体——来更好地处理。研究者通过提取三个描述刺激随时间复杂性的特征来检验这一假设。首先,如果两个随机扫描非常接近(“接近性”特征),单个神经元可能难以解析它们的同时精细变化,因为两个扫描兴奋相同的突触输入。其次,假设刺激复杂性随着两个扫描的平均速度(“平均速度”特征)增加而增加。第三,刺激复杂性对于高度负的局部相关性增加,指示随时间

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号