人类细胞形态的全基因组图谱

【字体: 时间:2025年02月05日 来源:Nature Methods 36.1

编辑推荐:

  大规模 DNA 测序技术的发展使人们能够获取大量基因型信息,但如何阐释基因型对人类生物学的多样化影响成为新挑战。将人类基因和基因型与疾病及性状相关表型系统地联系起来,仍是生物医学领域的重大难题。

  

构建全基因组细胞形态扰动图谱,解析基因与细胞功能关联


近日,来自 Broad Institute of MIT and Harvard 的研究人员在《Nature Methods》期刊上发表了题为 “A genome-wide atlas of human cell morphology” 的论文。该研究构建了首个基于形态学的全基因组扰动图谱,为大规模连接人类基因型与高维细胞表型提供了宝贵资源,在基因功能研究、疾病机制探索等方面具有重要意义。


研究背景


大规模 DNA 测序技术的发展使人们能够获取大量基因型信息,但如何阐释基因型对人类生物学的多样化影响成为新挑战。将人类基因和基因型与疾病及性状相关表型系统地联系起来,仍是生物医学领域的重大难题。


Pooled CRISPR 筛选技术虽强大,但在表型内容和规模上常需妥协。基因组规模的 Pooled CRISPR 筛选可系统评估基因功能,然而其兼容的表型(如增殖或细胞死亡)往往简单或需靶向检测,不适用于评估人类细胞中许多复杂、微妙的生物学过程。而高内涵分析方法(如成像、转录组学、蛋白质组学和代谢组学)虽能捕获丰富表型信息,但通常与基因组规模的扰动不兼容。因此,开发能全面绘制基因组范围基因敲除(KO)效应与高维表型关系的方法迫在眉睫。


研究材料和方法


  1. 实验细胞系:研究使用了多种细胞系,包括 HeLa(人宫颈癌细胞)、A549(人肺癌细胞)和 HEK293FT(用于病毒包装)等。这些细胞系在不同实验环节发挥关键作用,如 HeLa 和 A549 细胞用于进行全基因组筛选,以探究基因敲除对细胞形态的影响;HEK293FT 细胞则用于生产慢病毒,为基因导入提供载体。

  2. CRISPR 文库构建:设计针对 20,393 个基因的全基因组 CRISPR 向导 RNA(gRNA)文库,平均每个基因选择 4 个单向导(sg)RNAs,共 80,408 个 sgRNAs。这些 sgRNAs 从现有文库筛选而来,经过精心设计,确保在 12 轮原位测序(ISS)中可完全解卷积,且序列间 Levenshtein 距离为 2 以实现错误检测。随后将文库克隆到 CRISPR droplet sequencing(CROP-seq)载体,包装成慢病毒用于细胞转导。

  3. 实验流程:细胞培养在特定培养基中,如 A549 细胞使用高糖 DMEM 培养基,HeLa 细胞分别在传统 DMEM 培养基和生理培养基(HPLM)中培养。将慢病毒文库转导至细胞,通过嘌呤霉素筛选稳定转导的细胞。之后诱导 Cas9 表达,使 sgRNAs 发挥作用敲除目标基因。对细胞进行固定、透化处理,进行 ISS 以识别扰动,再用细胞区室特异性探针染色获取表型图像,通过特定策略消除荧光标记间的光谱重叠,确保实验数据的准确性。

  4. 数据分析方法:利用 CellProfiler 软件处理图像,进行背景校正、通道对齐和细胞特征提取等操作;使用 Pycytominer 库处理单细胞数据,进行数据标准化和特征选择,去除冗余、低方差和缺失值的特征。通过自定义算法进行命中调用,基于 Mann-Whitney u 检验比较靶向基因的 sgRNAs 与非靶向对照的特征分布,确定显著扰动的基因,同时采用错误发现率(FDR)进行校正,以控制假阳性率。


技术路线


  1. PERISCOPE 平台构建:开发优化的、可脱色的 Cell Painting 面板,通过荧光成像收集细胞区室的形态学数据,随后进行 ISS 确定细胞的扰动。使用基于二硫键连接的策略,实现荧光标记的细胞表型成像后有效脱色,为 ISS 腾出荧光通道。构建可扩展的开源分析流程,处理和分析大规模扰动数据集,包括图像特征提取、条形码解卷积和基因型 - 表型关联分析。

  2. 全基因组筛选实施:在 HeLa 细胞的两种不同培养基(DMEM 和 HPLM)及 A549 细胞中进行全基因组 Pooled CRISPR 筛选。在筛选过程中,严格控制实验条件,确保细胞覆盖率和数据质量。对筛选得到的数据进行深度分析,挖掘基因扰动与细胞形态变化之间的关系。

  3. 数据验证与分析:通过与现有基因功能数据库(如 CORUM 和 STRING)对比,验证基于图像的基因 KO 图谱的准确性,评估其捕获已知生物学关系的能力。运用基因集富集分析(GSEA)等方法,比较不同细胞系、不同培养基条件下基因扰动的差异,挖掘潜在的生物学机制。


研究结果


  1. 高维光学 CRISPR 全基因组筛选:构建全基因组 CRISPR gRNA 文库并进行筛选,利用自定义的命中调用流程,在不同错误发现率(FDR)下鉴定出大量全细胞和区室命中基因。对命中基因进行描述性分析,发现各亚细胞区室均有命中基因,且敲除已知在特定区室起作用的基因会产生相应的形态学表型。例如,敲除靶向线粒体外膜蛋白的基因,线粒体相关的形态学特征会发生显著变化。将基于图像的基因 KO 图谱与现有数据库对比,发现命中基因对在功能上具有相似性,且形态学图谱相关性与蛋白质 - 蛋白质相互作用置信度得分相关。通过无偏聚类和 UMAP 嵌入分析,揭示了命中基因基于生物学功能的逻辑聚类,涵盖 DNA 复制、溶酶体酸化等多种过程,同时信号通路也能被有效捕获。此外,多数筛选命中基因为非必需基因,且形态学信号得分与基因表达水平相关性不强。

  2. 全基因组基因 - 环境相互作用比较:在 HeLa 细胞的不同培养基条件下进行筛选,并开展 GSEA 分析,发现 391 个基因集在 DMEM 筛选中富集,321 个在 HPLM 筛选中富集,其中 275 个为两者共有。通过比较对角合并热图,观察到许多遗传扰动在两种培养基中产生相似的形态学影响,但也存在培养基特异性的富集过程。如 DMEM 筛选中与中央碳代谢相关的命中基因富集,可能与高葡萄糖水平有关;HPLM 筛选中与 DNA 损伤修复相关的过程富集,可能与培养基中葡萄糖和谷氨酰胺浓度降低导致的代谢重编程有关。

  3. 人肺癌细胞 A549 的全基因组扰动图谱:在 A549 细胞中进行全基因组筛选,获得大量单细胞形态学图谱。筛选出的命中基因分布于各个亚细胞区室,且物理相互作用的蛋白质更可能具有相似的形态学图谱。通过无偏聚类揭示了基于生物学功能的基因分组,包括糖基化、自噬等过程。不过,A549 数据集整体信号低于 HeLa 数据集,主要原因是 A549 Cas9 细胞系的 CRISPR 效率较低,这表明增加细胞覆盖率可能提高检测扰动表型的能力。

  4. 全基因组亚细胞表型筛选:PERISCOPE 生成的高维图谱包含数千个表型特征,对单个特征进行分析发现,具有 GO 富集的特征在成像通道和特征类别的分布并不均匀。例如,纹理类特征中具有 GO 富集的比例较高。通过对特定基因集的分析,验证了数据集单特征筛选的有效性,如破坏液泡 ATP 酶会导致 WGA 通道中粒度特征的特定变化。此外,开发了图谱细胞检索工具,虽多数单基因 KO 表型难以通过肉眼识别,但该工具结合计算特征提取和分析,有助于深入挖掘表型信息。

  5. TMEM251/LYSET 对溶酶体酶转运的重要性:基于形态学图谱,发现未表征基因 TMEM251 与溶酶体酸化相关基因聚类。通过 GSEA 分析、亚细胞定位实验和功能验证实验,确定 TMEM251 主要定位于高尔基体,其功能缺失会导致溶酶体中 WGA 荧光积累,影响溶酶体酶的活性。进一步研究表明,TMEM251 参与甘露糖 - 6 - 磷酸(M6P)途径,在溶酶体酶的转运中起关键作用,这一结果与其他研究独立验证了 TMEM251 在溶酶体蛋白转运中的重要性。


研究结论


本研究构建了首个基于形态学的人类细胞全基因组扰动图谱,利用 PERISCOPE 平台实现了全基因组范围的高维光学 CRISPR 筛选。通过在多种细胞系和培养基条件下的筛选,获得了丰富的基因扰动与细胞形态表型数据,成功揭示了大量基因的功能、基因 - 环境相互作用以及亚细胞表型信息。同时,研究还鉴定出 TMEM251/LYSET 在溶酶体酶转运中的关键作用,为深入理解细胞生物学机制提供了新线索。


研究讨论


Pooled 光学筛选是一种强大的新技术,PERISCOPE 平台使大规模生成高维基因型 - 表型图谱成为可能,且成本较低。该平台不仅可用于研究基因功能、重建生物途径和蛋白质相互作用网络,还能有效探究基因 - 环境相互作用,为药物研发、疾病机制研究等提供有力支持。


然而,PERISCOPE 技术仍存在一些局限性。当前实验流程较为繁琐,劳动强度大,主要与处理的板数相关,自动化可显著提高通量。同时,信号质量有待提升,可通过优化阴性对照扰动和改进计算流程来实现。此外,目前研究主要集中在两种癌细胞系,未来可扩展到更多细胞模型。


展望未来,PERISCOPE 平台可用于探索其他 CRISPR - 基于的扰动(如 CRISPR - a、CRISPR - i 或碱基编辑)的影响。结合高度复用的成像技术(如 CODEX 和 CyCIF)和深度学习方法,有望进一步提高检测灵敏度和数据分析能力。增加细胞采样和改进计算流程,将有助于更深入地挖掘生物学信息,推动生命科学研究的发展。


综上所述,该研究成果为连接人类基因型与细胞功能提供了丰富资源,PERISCOPE 平台具有广阔的应用前景,有望在未来生物医学研究中发挥重要作用,推动相关领域取得更多突破。


相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号