编辑推荐:
在空间转录组学研究中,细胞类型的空间分布常干扰基因间真实关联的挖掘。研究人员开发 InSituCor 工具,分析结肠肿瘤和胰腺癌数据,发现其能精准识别排除干扰后的基因模块,助力解析细胞间复杂关系,为相关研究提供关键支撑。
在生命科学研究的广袤领域中,空间转录组学就像是一座神秘的宝藏矿山,蕴含着无数关于细胞间相互作用和生命奥秘的珍贵信息。它能够在原位对数百到数千个基因进行测量,为我们揭示细胞在空间层面的基因表达模式,就像给微观世界绘制了一幅高清地图。然而,这座 “矿山” 却布满了 “陷阱”。大部分细胞类型在空间上并非随机分布,而是有着特定的组织方式,这就导致那些具有细胞类型特异性表达的基因之间出现空间相关性。这种相关性就如同迷雾,掩盖了我们真正想要探索的基因间的内在联系,让研究人员难以发现那些隐藏在背后的、真正有趣的生物学现象。比如,在分析肿瘤微环境中的基因表达时,由于肿瘤组织中不同细胞类型的聚集分布,使得一些基因看似存在空间关联,但实际上可能只是因为它们与特定细胞类型的分布有关,而并非存在直接的生物学联系。因此,如何拨开这层迷雾,准确挖掘出有价值的基因空间相关性,成为了空间转录组学研究亟待解决的难题。
为了攻克这一难题,来自美国 Bruker Spatial Biology 等多个研究机构的研究人员展开了深入研究。他们经过不懈努力,开发出了一款名为 InSituCor 的强大工具。这一研究成果发表在《Genome Biology》杂志上,为空间转录组学研究带来了新的曙光。
在研究过程中,研究人员运用了多种关键技术方法。他们使用 CosMx RNA 协议对组织样本进行处理,获取单细胞基因表达数据。在细胞类型鉴定方面,借助 InSituType R 包,通过半监督或监督模式对细胞进行分类。对于空间区域的划分,采用 DBSCAN 算法对细胞位置进行聚类。这些技术相互配合,为 InSituCor 工具的应用提供了坚实的数据基础和分析框架。
下面让我们来详细了解一下 InSituCor 的研究结果。
- InSituCor 算法原理及优势:InSituCor 算法的核心是计算环境表达矩阵(基于每个细胞周围邻域的基因表达构建)在考虑环境混杂矩阵(包含细胞类型丰度等混杂变量)条件下的相关性。通过这种方式,它能够过滤掉由细胞类型等已知因素导致的空间相关性,只保留那些真正具有生物学意义的基因关联。与传统方法相比,InSituCor 的条件相关性分析大大减少了虚假关联的干扰。在对结肠肿瘤数据集的分析中,未调整混杂因素时,前 5000 对基因对的相关性范围在 (0.62, 0.97) ,而经过 InSituCor 调整后,只有 1018 对基因对的相关性大于 0.2。这表明大部分未调整分析中的强空间相关性,在去除细胞类型等干扰因素后,并不值得深入研究,充分体现了 InSituCor 的精准性和有效性。
- 基因模块挖掘及功能解析:InSituCor 能够提取相互共表达的基因模块,为深入理解生物学过程提供了有力支持。在结肠肿瘤研究中,它发现了一个由 17 个基因组成的模块,这些基因涉及微环境重塑(如 CCL18、MMP2、CSTK)、生长因子信号传导(如 SFRP2、GREM1、DCN、SERPINF1 )和炎症反应(如 C3、C1R、PTGIS)等多个方面,共同暗示了肿瘤促进炎症的过程。通过对模块得分的计算和分析,研究人员发现该模块在肿瘤间质中表达较高,在肿瘤床也有一些热点区域。进一步分析单细胞得分,发现癌相关成纤维细胞(CAFs)和巨噬细胞是驱动该模块活性的主要细胞类型,附近的肥大细胞、平滑肌细胞和基质细胞也参与其中。这一发现为深入了解肿瘤微环境中炎症发生机制提供了新的视角。
- 知识驱动的分析应用:InSituCor 支持知识驱动的工作流程,研究人员可以围绕感兴趣的基因进行深入探索。在对肿瘤信号环境的研究中,他们仅分析数据集中的 407 种配体,发现了多个与肿瘤免疫反应相关的模块。其中,趋化因子 CCL19 和 CCL21 所在的模块集中在肿瘤周边的狭窄区域,MHC2 抗原呈递基因模块在该区域略有扩散,而 MHC1 抗原呈递基因模块在相同区域达到峰值并进一步延伸到肿瘤床。这一结果提示了一种可能的免疫反应机制:趋化因子表达吸引抗原呈递细胞,进而引发适应性免疫反应,促使周围细胞表达 MHC1。此外,研究人员还对配体 - 受体对进行分析,发现只有少数配体 - 受体对(如 FCER2 和 CR2)具有较高的条件相关性。进一步研究发现,CR2 属于一个与 B 细胞发育、激活和运输相关的紧密连接的基因网络,这为研究 B 细胞相关的生物学过程提供了新的线索。
- 空间区域特异性分析:InSituCor 不仅可以针对特定基因进行分析,还能够聚焦于特定的空间区域。在对结肠肿瘤中三级淋巴结构(TLS)的研究中,研究人员发现了与 B 细胞迁移和成熟以及 MHC II 类抗原呈递和抗体产生相关的模块。与全组织分析相比,针对 TLS 的分析发现了 52 对在全组织分析中相关性近零,但在 TLS 中具有强条件相关性的基因对。这表明空间靶向分析能够揭示在全组织分析中被掩盖的基因关系,为深入研究特定区域的生物学功能提供了更精准的方法。
- 多样本研究中的应用:研究人员将 InSituCor 应用于 19 个胰腺导管腺癌(PDAC)肿瘤的组织微阵列分析。通过寻找在多个组织中一致存在的条件相关性,他们发现了一些已知的关系模块,如由 B2M 和 MHC I 类基因相关探针组成的模块,以及免疫球蛋白 lambda 基因模块。同时,还发现了一些新的模块,如以 S100A6 为中心,涉及细胞粘附、上皮 - 间质转化、代谢和蛋白酶体活性等功能的模块。该模块的表达由癌细胞驱动,在不同肿瘤之间以及同一肿瘤内部存在差异。此外,研究人员还关注了在不同肿瘤间表现出高度可变行为的条件相关性。他们发现了一个与炎症和侵袭相关的基因模块,在部分肿瘤中具有高条件相关性,而在其他肿瘤中相关性减弱或不存在。进一步分析发现,不同大小肿瘤腺体相关的基因模块存在差异,这为研究 PDAC 的肿瘤异质性提供了重要依据。
在研究结论和讨论部分,InSituCor 的重要意义得到了充分体现。它通过基于细胞类型景观等混杂因素进行条件分析,成功排除了大量由细胞类型空间分布导致的虚假基因相关性,准确揭示了那些真正具有生物学意义的基因关联,大大提高了空间转录组学研究的效率和准确性。在计算时间和分析人员的时间成本上,InSituCor 都展现出了优势,能够快速筛选出值得深入研究的空间相关性,为后续的生物学机制研究节省了大量资源。此外,InSituCor 还有助于发现被初始细胞分型遗漏的细胞类型,为细胞生物学研究提供了新的思路。然而,研究人员也指出,InSituCor 目前仍存在一些局限性。例如,它对细胞邻域的定义较为简单,可能无法完全反映真实的细胞间相互作用范围;同时,它对空间相关的技术伪影较为敏感,虽然能够检测到这些伪影,但也可能影响分析结果的准确性。尽管如此,InSituCor 的出现无疑为空间转录组学研究开辟了新的道路,为我们深入理解细胞间的相互作用、肿瘤微环境以及疾病发生发展机制提供了强大的工具,有望在未来的生命科学和医学研究中发挥更大的作用。