编辑推荐:
为解决空间蛋白质组学难题,研究人员开发 S4P 策略,绘制小鼠脑蛋白质组图谱,意义重大。
在生命科学的微观世界里,哺乳动物的器官和组织就像一座神秘的城市,由各种各样的细胞组成,这些细胞在空间上有序分布,相互协作,共同维持着生命的运转。细胞中的生物分子,尤其是蛋白质,它们的空间分布对于理解细胞功能、组织发育以及疾病发生机制至关重要。然而,目前的研究手段却面临着诸多挑战。
转录组学领域,高通量空间技术蓬勃发展,能够深入剖析基因表达情况。但蛋白质作为生命活动的直接执行者,其空间分布的研究却困难重重。蛋白质不像核酸那样可以扩增,质谱(MS)检测的灵敏度也有限,这使得实现全组织水平的空间蛋白质组覆盖成为一项艰巨的任务。现有的蛋白质组学方法,如成像质谱细胞术(IMC)虽然具有单细胞灵敏度,但它是基于靶向的方法,能检测的蛋白数量有限;液相色谱 - 串联生物质谱(LC - MS)虽能检测大量蛋白,但在高空间分辨率下,样本量需求大,数据采集时间长。例如,对直径 1 厘米的圆形组织切片进行 100μm 分辨率的全组织切片覆盖分析,需要约 8000 个样本,耗费 8000 - 10000 小时的质谱仪时间,这在常规研究中几乎难以实现。因此,开发一种能够在合理时间内实现高分辨率、全组织切片蛋白质组分析的方法迫在眉睫。
为了攻克这些难题,清华大学、北京蛋白质组研究中心等研究机构的研究人员展开了深入探索。他们开发了一种用于空间蛋白质组学的稀疏采样策略(S4P),并结合深度学习辅助的图像重建方法,成功绘制了小鼠脑的空间蛋白质组图谱,相关研究成果发表在《Cell Discovery》上。
研究人员在研究过程中运用了多种关键技术方法。在样本制备方面,先对小鼠脑进行冷冻切片,切成 10μm 厚的切片,再用激光捕获显微切割(LMD)技术将其切成平行条带。蛋白质组分析时,对条带样本进行处理后用 LC - MS/MS 分析。为了避免批间效应,采用滑动窗口策略对样本进行随机化处理。同时,通过引入质量控制样本,监测实验的可变性。在数据处理和图像重建阶段,利用深度学习模型 DeepS4P,对蛋白质组数据进行空间重建,从而获得蛋白质在组织切片中的定位和分布信息。
研究结果主要包含以下几个方面:
- 蛋白质组采样、数据采集和质量控制:研究人员从多个角度对 S4P 策略的可靠性进行评估。在样本制备的重复性上,对相邻切片相同轴向位置的条带进行分析,发现不同区域条带鉴定出的蛋白数量相近且重叠度高,蛋白质丰度分布均匀,变异系数(CV)低,主成分分析(PCA)也显示相同轴向位置条带的蛋白质组特征高度相似。在数据采集的稳定性方面,通过向样本中加入合成肽(iRT)监测 LC 系统的稳定性,结果显示保留时间变化很小;对质谱仪也进行常规监测,确保仪器处于良好状态。通过这些措施,共映射和定量了小鼠脑条带中的 234,768 个肽段和 9318 种独特蛋白质,表明 S4P 策略能够产生高质量的蛋白质组数据。
- 小鼠脑空间蛋白质组(SP)重建和准确性评估:利用 DeepS4P 模型对 S4P 数据进行空间重建,获得了 9204 种蛋白质的分布图谱。通过对蛋白质表达相关性的分析,发现已知位于不同解剖区域的蛋白质能够很好地分离,表明 S4P 数据可用于展示蛋白质在组学水平的分子组织。与免疫组织化学(IHC)这一 “金标准” 方法对比,S4P 重建的蛋白质分布与 IHC 结果一致。对于不同解剖区域和细胞类型的标记蛋白,S4P 能准确地将它们定位到预期区域,还发现了一些潜在的新脑区标记蛋白。此外,对预期具有相同空间位置的蛋白质对(如异源二聚体蛋白、蛋白质复合物的亚基等)的分析显示,S4P 重建的图像具有高度的相似性,余弦相似度(CS)高,进一步证明了 S4P 的可靠性。与基于网格的空间蛋白质组学策略对比,S4P 在数据采集时间上更具优势,且两者整体的 SP 比较具有较高的一致性。
- 小鼠脑蛋白质空间分布景观:S4P 实现了目前最深的小鼠脑 SP 覆盖,量化和定位了 9000 多种蛋白质,分辨率约为 500μm。通过对关键基因本体(GO)生物学过程中典型蛋白质的分析,发现参与神经递质传递、突触组织和调节等过程的蛋白质存在区域相似性和变异性,这有助于理解神经系统的功能以及神经疾病的发病机制。同时,S4P 展示了多种京都基因与基因组百科全书(KEGG)途径中蛋白质的分布模式,在多个与大脑功能相关的途径中实现了深度蛋白质成分覆盖,为研究大脑发育、神经传递和信号传导过程提供了重要信息。
- S4P 和空间转录组(ST)映射的相关性分析:研究人员对 S4P 和 ST 数据进行分析,发现不同分子对的空间表达相关性差异很大。对正相关、不相关和负相关的转录 - 蛋白对进行基因本体(GO)富集分析,分别发现它们与突触调节、细胞代谢和神经调节等功能相关。这表明直接绘制蛋白质的数量和位置具有重要意义,进一步凸显了 S4P 技术的优势。
研究结论和讨论部分指出,S4P 方法成功探索了小鼠脑中 9000 多种蛋白质的表达和分布模式,相比之前的研究,在蛋白质组覆盖深度和数据采集时间上具有明显优势。该方法为脑科学研究提供了宝贵的资源,有助于深入理解组织异质性、细胞功能和疾病病理。然而,S4P 目前也存在一些局限性,如条带宽度的限制导致空间分辨率难以进一步提高,重建空间蛋白质组目前需要八个相邻切片等。未来可以通过结合组织扩张方法等手段来解决这些问题。总体而言,S4P 作为一种创新的空间蛋白质组学方法,为生命科学研究开辟了新的道路,有望在疾病诊断、治疗靶点发现等领域发挥重要作用,推动生物医学的发展。