ScGOclust:基于基因本体论的跨物种细胞功能相似性分析工具揭示远缘物种间细胞类型的功能同源性

【字体: 时间:2025年07月16日 来源:Bioinformatics 4.4

编辑推荐:

  本研究针对远缘物种间细胞类型比较的难题,开发了scGOclust工具,通过构建基于基因本体论(GO)的细胞功能谱,系统分析了小鼠与果蝇的心脏、肠道和肾脏以及秀丽隐杆线虫与水螅的全身体数据,揭示了功能同源细胞类型和功能趋异现象,为进化生物学和功能基因组学研究提供了新视角。

  

在生命科学领域,一个长期存在的难题是如何比较远缘物种间的细胞功能。随着单细胞转录组技术的普及,科学家们获得了海量的跨物种细胞图谱数据,但传统的基因同源比对方法在比较不同门类生物时显得力不从心。这就像试图用不同的语言词典直接比较两首诗歌的意境——虽然单词可能对应,但整体含义却难以捉摸。特别是在比较脊椎动物和无脊椎动物时,这种局限性更为明显,因为这些生物虽然拥有功能相似的器官,却在形态和分子机制上表现出惊人的多样性。

欧洲分子生物学实验室欧洲生物信息学研究所(European Bioinformatics Institute, European Molecular Biology Laboratory)的研究团队另辟蹊径,将目光投向了基因本体论(Gene Ontology, GO)这一全球最大的基因功能知识库。他们开发的scGOclust工具创新性地利用GO术语构建细胞功能谱,成功实现了从果蝇到小鼠、从线虫到水螅的跨物种细胞功能比较。这项突破性研究发表在生物信息学顶级期刊《Bioinformatics》上,为进化发育生物学和比较基因组学研究提供了全新范式。

研究团队采用了多组学整合分析策略:首先从公开数据库获取小鼠和果蝇的心脏、肠道、肾脏单细胞RNA测序(scRNA-seq)数据,以及线虫和水螅的全身体图谱;通过生物信息学流程处理原始数据后,利用ENSEMBL和eggNOG-mapper获取基因的GO注释;创新性地将基因表达矩阵与GO注释矩阵相乘,构建细胞功能谱;通过主成分分析(PCA)和UMAP降维可视化功能相似性;最后采用Pearson相关性分析量化跨物种细胞类型的功能相似度。特别值得注意的是,研究者建立了严格的证据代码筛选体系,区分实验验证与计算预测的GO注释,确保分析结果的可靠性。

【功能相似性分析揭示心脏细胞保守特征】

通过比较小鼠和果蝇心脏细胞类型的GO生物过程(BP)谱,研究发现肌肉细胞类型和神经元细胞类型在物种间表现出高度功能保守性。具体而言,心肌细胞共同上调的GO术语包括"心肌收缩"、"骨骼肌纤维组装"和"肌肉发育"等核心功能。更引人注目的是,研究者发现小鼠雪旺细胞与果蝇心脏外周神经元共享"动作电位"、"膜去极化"等典型神经元功能术语,证实了神经细胞在进化过程中的功能保守性。

【肠道分析发现新型分泌细胞亚群】

在比较消化系统时,scGOclust不仅验证了已知的干细胞功能保守性,还发现果蝇嗉囊中存在一个特殊亚群(crop_2),其GO谱显示蛋白质翻译和脂质合成过程显著活跃。基因表达分析进一步证实该亚群高表达核糖体蛋白(RpL37A、RpL30等)和脂质合成酶(Hacd1、Agpat3),特别是昼夜节律调控基因to的显著表达,暗示这些细胞可能参与摄食行为的节律调控。这一发现为理解昆虫消化系统的分泌功能提供了新线索。

【肾脏比较提出功能分段新见解】

在肾脏系统分析中,scGOclust得出了与传统基因同源比对不同的结论:果蝇主段主细胞(principal cells, PCs)与小鼠远端小管和连接小管功能相似,而非原先认为的近端小管。这一结论得到离子稳态相关GO术语的支持,如"钾离子转运"、"钠离子转运"等,与两物种对应区段的生理功能高度吻合。研究者还追踪了离子通道基因(如Irk1/3、Trpm等)的跨物种表达模式,进一步验证了这一功能对应关系。

【极端远缘物种比较验证工具普适性】

为测试工具的极限性能,研究者将其应用于分化于刺胞动物-两侧对称动物分歧时期的线虫和水螅。尽管这两个物种的GO注释完全依赖序列同源推断,scGOclust仍成功识别出干细胞、神经元等功能保守的细胞类型,展示了该方法在非模式生物中的应用潜力。

这项研究的创新价值体现在多个层面:方法论上,scGOclust首次实现了基于GO术语的从头细胞功能谱构建,突破了传统基因同源比对的局限;生物学发现上,不仅验证了已知同源细胞类型的保守性,还揭示了脂肪体与心肌、周细胞与神经元等非同源细胞类型间的功能趋同现象;技术上,建立的证据代码筛选体系为GO注释的质量控制提供了新标准。尤为重要的是,该工具对注释完整性的低依赖使其能够应用于数千个已有GO注释但缺乏单细胞数据的物种,极大拓展了比较生物学的研究疆域。

研究团队在讨论中特别指出,scGOclust与主流方法SAMap形成互补关系:前者关注功能相似性,后者侧重基因同源性。在果蝇肾脏主段主细胞的案例中,scGOclust基于生理功能的重构更符合实验证据,彰显了功能视角的独特价值。未来,这种多方法交叉验证的策略有望成为跨物种细胞图谱研究的黄金标准。

这项研究的潜在影响远不止于基础科学。在医学研究领域,通过远缘模式生物解析人类细胞功能的进化起源,可以更精准地选择疾病模型;在合成生物学中,理解功能保守性有助于设计跨物种兼容的基因回路;甚至在濒危物种保护方面,该方法可能帮助预测气候变化对特定细胞功能的潜在影响。随着单细胞技术在非模式生物中的普及,scGOclust或将成为比较生物学家的必备工具,开启"功能进化"研究的新纪元。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号