Z分数标准化方法在CRISPR并行基因合成致死筛选分析中的优势与应用

【字体: 时间:2025年07月03日 来源:Genome Biology 10.1

编辑推荐:

  本研究针对CRISPR单基因敲除筛选无法检测功能冗余旁系同源基因的局限性,研究人员系统评估了四种CRISPR/Cas12a并行基因筛选数据分析方法。通过比较delta log fold change(dLFC)、Z-transformed dLFC(ZdLFC)和rescaled dLFC(RdLFC)三种算法,发现ZdLFC方法无需训练集即可实现跨细胞系的高一致性筛选结果,为肿瘤特异性靶点发现提供了更可靠的生物信息学工具。该成果发表于《Genome Biology》。

  

在癌症研究领域,寻找肿瘤特异性治疗靶点一直是科学家们追求的目标。CRISPR基因编辑技术虽然为大规模基因筛选提供了强大工具,但传统单基因敲除筛选存在一个致命盲区——当基因存在功能冗余的"备份"时(通常是旁系同源基因paralogs),单一基因的敲除往往不会表现出明显的表型变化。这就好比电脑系统的重要功能由两个并行程序支撑,关闭其中一个时系统仍能正常运行,只有同时关闭两个才会导致系统崩溃。这种基因间的功能补偿现象使得大量潜在治疗靶点在常规筛选中被遗漏。

为了突破这一技术瓶颈,德克萨斯大学MD安德森癌症中心的研究团队在《Genome Biology》发表了一项重要研究。他们系统比较了四种分析CRISPR并行基因筛选数据的方法,发现经过Z分数标准化处理的ZdLFC方法能更可靠地识别旁系同源基因间的合成致死(synthetic lethal)相互作用,为肿瘤精准治疗提供了新的分析工具。

研究采用了两种关键技术方法:一是基于Cas12a的in4mer多重敲除平台,在K562、A549等四种癌细胞系中筛选了1944对旁系同源基因;二是开发了三种定量分析算法(dLFC、ZdLFC和RdLFC),通过比较Jaccard相似系数评估各方法的稳定性。特别值得注意的是,研究团队没有依赖预设的"金标准"训练集,而是创新性地利用数据分布特征建立统计模型。

【Measuring synthetic lethality between paralog pairs】
研究人员首先建立了三种量化基因相互作用的方法体系。最基础的delta log fold change(dLFC)直接计算双基因敲除观察值与单基因敲除预期值的差值。为提高准确性,团队进一步开发了Z-transformed dLFC(ZdLFC)方法,通过高斯分布拟合数据分布特征,建立零模型进行标准化处理。作为对比,还测试了需要训练集的rescaled dLFC(RdLFC)方法。结果显示,ZdLFC方法在保持与RdLFC相当性能的同时,摆脱了对预设阳性对照的依赖。

【Relative performance】
通过系统比较四种细胞系的筛选结果,ZdLFC和RdLFC方法表现出显著优于原始dLFC的跨实验一致性(中位Jaccard系数约0.33)。特别值得注意的是,在四组实验中重复出现的阳性hit具有更高的序列相似性,如PITPNA/B、HDAC1/2等经典合成致死对。同时,研究也发现了一些背景特异性相互作用,如NRAS/KRAS在K562细胞中的特异性合成致死效应,揭示了肿瘤基因型与合成致死关系的复杂关联。

【Conclusions】
这项研究确立了ZdLFC作为分析并行基因筛选数据的优选方法,其无需训练集的特点大大增强了实验设计的灵活性。约50%的跨实验一致性反映了当前技术平台的检测极限,提示未来研究需要区分真实背景特异性相互作用与技术假阴性。值得注意的是,Cas12a与Cas9平台在检测效能上表现出相当的灵敏度,为研究者提供了更多技术选择。

该研究的创新价值在于:首次系统评估了不同算法在并行基因筛选中的表现,为领域建立了分析方法标准;证实旁系同源基因间的合成致死相互作用具有较高的保守性,为开发广谱抗癌策略提供了理论依据;建立的ZdLFC分析方法可推广至更广泛的基因相互作用研究,包括非旁系同源基因组合和多基因相互作用网络。这些发现将助力于破解肿瘤细胞的"备份系统",揭示更多隐藏的治疗靶点。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号