编辑推荐:
为分析细胞间通信下游功能及空间模式,研究人员开发 SpaCcLink,能精准识别关键分子,深化对细胞的理解。
细胞就像一个个 “小居民”,在身体这个庞大的 “城市” 里各司其职。它们之间并非孤立存在,而是通过细胞间通信(Cell–cell communication)相互交流、协作,维持着身体的正常运转。细胞间通信在细胞分化、增殖、发育以及免疫反应等诸多重要生命活动中,都发挥着不可或缺的作用。可以说,深入了解细胞间通信,就如同掌握了打开生命奥秘大门的钥匙,对于我们理解生物系统的结构和功能,乃至攻克各种疾病都有着极为重要的意义。
随着科学技术的不断进步,单细胞转录组测序(scRNA-seq)技术的出现,让科学家们在解析细胞间通信方面取得了一定进展。然而,现有的分析方法仍存在不少局限性。一方面,许多方法在研究细胞间通信时,没有充分考虑到细胞内的下游信号转导过程,就好比只关注了 “居民” 之间传递的信件内容,却忽略了收到信件后 “居民” 的行动和反应。另一方面,传统方法在处理下游信号时,也未能很好地整合基因网络和基因表达信息,导致对细胞通信的分析不够全面和深入。
为了填补这些研究空白,西安电子科技大学和第四军医大学西京医院的研究人员展开了深入研究。他们提出了一种名为 SpaCcLink 的空间细胞间通信分析方法,旨在系统地探究细胞间通信的空间模式以及下游信号网络,为我们揭示细胞间通信的神秘面纱。该研究成果发表在《BMC Biology》杂志上。
研究人员在开展此项研究时,运用了多种关键技术方法。首先,他们从多个数据库收集了配体 - 受体(LR)对和基因信号网络数据,为后续研究奠定基础。在模型训练方面,采用了基于三元组损失(triplet loss)的方法,通过构建训练数据,让模型学习基因之间的相互作用关系。同时,运用图注意力网络(GAT)模型,从基因表达数据中提取潜在特征,以此来识别与受体相关的目标基因。此外,利用 Wasserstein 距离划分配体 - 受体对的相互作用类型,并通过计算交叉莫兰指数(Cross Moran’s I index)来识别具有空间依赖性的配体 - 受体对。
研究结果
- 人类黑色素瘤数据中通信模式和显著 LR 对的识别:研究人员将 SpaCcLink 应用于人类黑色素瘤数据,通过计算每个受体的下游影响分数并结合空间通信分析,成功识别出了具有显著下游影响和空间依赖性的受体。对受体下游影响分数进行非负矩阵分解(NMF)后,得到了两种下游信号通信模式。其中,模式 0 主要与黑色素瘤细胞的分布区域一致,模式 1 则主要对应 B 细胞区域以及癌症相关成纤维细胞(CAF)与黑色素瘤之间的某些边界区域。通过分析模式 1 中排名靠前的基因,发现 ALOX5、CD79A 和 CXCR12 等基因特异性较高。基因本体生物学过程(GOBP)富集分析表明,模式 1 与白细胞细胞黏附调节、细胞激活和炎症反应等生物学过程密切相关,这意味着模式 1 可能在免疫系统调节和炎症过程中发挥重要作用。
- 人类乳腺癌数据中预后受体基因和下游信号的识别:在对人类乳腺癌数据的研究中,研究人员同样对具有显著影响和空间依赖性的受体基因下游信号分数进行模式识别,得到了四种通信模式。其中,模式 1 主要与免疫细胞区域相关,模式 2 主要集中在恶性细胞类型 basal_like_1 和基质细胞之间,可能与肿瘤的侵袭性和攻击性有关,模式 3 主要聚集在恶性细胞区域。对模式 1 中高负荷分数的受体基因进行生存分析发现,某些特定受体基因的表达显著影响患者的生存时间。以 CD3D 和其空间依赖性配体 HLA - B 为例,它们之间的通信主要发生在 basal_like_1 细胞内以及 basal_like_1 细胞与巨噬细胞之间。信号从 basal_like_1 细胞传递到巨噬细胞,主要通过配体 HLA - C 和 HLA - B 与受体分子 CD3D 和 LILRB2 相互作用来实现,最终传递到下游靶基因 UBAP2L、VAMP3 和 VCAN。对 CD3D 下游信号通路相关基因的 GOBP 富集分析表明,其主要富集在免疫反应激活细胞表面受体信号通路、细胞对细胞因子刺激的反应以及免疫系统中的细胞因子信号传导等功能,这说明 CD3D 在免疫反应和细胞因子信号传导中可能发挥重要作用。
- 小鼠大脑数据中关键转录因子和完整下游信号通路的识别:研究人员将 SpaCcLink 应用于小鼠大脑数据,识别出了与细胞类型分布密切相关的四种模式。以模式 0 为例,其主要聚集在小鼠皮层和锥体层区域,该模式中的特定基因 Robo2、Cckbr 和 Cnr1 等与相应配体的通信主要发生在特定细胞类型之间,如 Cckbr 与其配体 CcK 主要在 Cortex_3 细胞内以及 Cortex_1 和 Cortex_3 之间进行通信。研究人员利用 Fisher 精确检验,识别出了每个受体基因激活的下游转录因子(TF),并可视化了从受体到转录因子再到靶基因的完整信号转导网络。通过对下游基因的 GOBP 富集分析,进一步证实了所识别的功能性转录因子与细胞对有机氮化合物的反应、对肽的反应以及行为相关过程的关联。这一研究成果有助于深入理解小鼠大脑的功能和调节机制。
- 与其他方法的比较:研究人员将 SpaCcLink 与 SpaTalk、NicheNet 和 CellCall 等方法进行比较,评估它们在推断不同细胞类型内细胞内下游信号通路的性能。结果发现,SpaCcLink 识别出的下游基因与受体相关的生物学过程或通路的关联更强。在推断配体 - 受体相互作用方面,虽然 SpaCcLink 推断出的 LR 对数量相对较少,但与其他方法的重叠率更高,尤其是与 COMMOT 方法,这表明 SpaCcLink 在推断 LR 相互作用时具有更高的可靠性。
研究结论与讨论
SpaCcLink 作为一种创新的空间细胞间通信分析方法,成功地将细胞内的下游信号反应与空间表达关系相结合。通过对人类黑色素瘤、人类乳腺癌和小鼠大脑三个真实数据集的研究,有力地证明了 SpaCcLink 能够有效识别具有显著下游影响和空间表达依赖性的配体和受体,进而揭示其下游细胞内信号传导。与其他方法相比,SpaCcLink 在识别更可靠的配体 - 受体关系以及更高效地识别与生物学过程相关的通路方面表现出色。
然而,SpaCcLink 也存在一定的局限性。例如,由于其依赖基因网络,在基因数量较少的情况下,其准确性和可靠性可能会受到限制。此外,现有的配体 - 受体数据库无法提供配体和受体之间相互作用模式的详细信息,导致 SpaCcLink 在分类 LR 对时计算时间较长。但随着单细胞分辨率空间转录组测序技术的不断发展,未来有望在更高分辨率水平上探索细胞通信的完整过程,从而进一步提高分析结果的准确性。
总体而言,SpaCcLink 的出现为生命科学研究提供了一种强大的工具,有助于科学家们更深入地理解细胞间通信的机制,为揭示生物系统的奥秘以及攻克相关疾病提供了新的思路和方法。