揭秘基因 “暗语”:打破上位性测量公式的迷障,解锁生命遗传密码

【字体: 时间:2025年02月19日 来源:Nature Communications 14.7

编辑推荐:

  为解决上位性测量公式不一致问题,普林斯顿大学研究人员开展相关研究。结果表明嵌合公式在高阶互作测量上存在缺陷,乘法和加法公式更合理。推荐阅读,助你深入理解基因互作测量,为相关科研提供新思路。

  
在生物学的神秘世界里,基因之间的相互作用一直是科学家们关注的焦点。其中,上位性(epistasis),也就是不同基因座(locus,指基因在染色体上的位置)上的等位基因(allele,基因的不同形式)之间的相互作用,在生物的各种现象中起着极为关键的作用。它就像一张无形的网,连接着基因与生物的适应性(fitness,可理解为生物在特定环境下生存和繁殖的能力),影响着生物的进化历程、蛋白质的功能,甚至与抗生素耐药性等问题息息相关。

然而,在探索这张 “基因相互作用网” 的过程中,科学家们遇到了一些棘手的问题。目前,有多种方法用于量化上位性,但其中一些方法存在争议。许多研究采用了一种 “嵌合公式(chimeric formula)” 来量化上位性,这个公式在乘法适应性模型的基础上,却用加法尺度来衡量偏差,就像是把两种不同的 “尺子” 混在一起用,这让科学家们对上位性的理解变得混乱起来。在这种情况下,为了更准确地理解基因之间的相互作用,普林斯顿大学的 Uthsav Chitra、Brian Arnold 和 Benjamin J. Raphael 等研究人员,在《Nature Communications》期刊上发表了题为 “Resolving discrepancies between chimeric and multiplicative measures of higher-order epistasis” 的论文,试图揭开这些问题背后的真相。

研究人员通过深入研究,得出了一系列重要结论。他们发现,对于双位点相互作用,嵌合公式和乘法公式(multiplicative formula,一种更符合乘法适应性模型的公式)虽然在衡量上位性的强度上有所不同,但得出的相互作用的符号(正或负,代表不同的相互作用类型)是一致的。不过,当涉及到三位点及以上的高阶相互作用时,情况就变得复杂起来。这两个公式不仅在数值大小上存在差异,就连相互作用的符号都可能不同,这意味着它们可能会给出完全相反的结论,一个说相互作用是正的,另一个却说是负的。研究还表明,不同的上位性公式实际上对应着多元伯努利分布(multivariate Bernoulli distribution,一种描述二进制随机变量分布的数学模型)的不同参数化形式,而嵌合公式在统计上并不如加法公式(additive formula)和乘法公式合理,它可能会导致错误地检测到高阶上位性,进而对实验结果产生误导。这项研究的意义重大,它为上位性的研究提供了更准确的方法和理论基础,帮助科学家们在研究基因相互作用、药物反应、蛋白质适应性等方面少走弯路,让我们对生物现象的理解更加深入和准确。

为了开展这项研究,研究人员主要运用了以下关键技术方法:一是构建数学模型,通过推导上位性与多元伯努利分布参数之间的联系,从数学层面解释不同上位性公式的本质;二是进行模拟实验,利用乘法适应性模型和 NK 模型(一种经典的模拟随机适应性景观的模型)来模拟不同的遗传场景,对比不同公式在这些场景下的表现;三是对实际生物数据进行分析,如分析酵母的多基因敲除数据、大肠杆菌的药物相互作用数据以及多种蛋白质的深度突变扫描(deep mutational scanning,一种高通量技术,用于测量蛋白质多种变体的适应性)数据,通过实际案例揭示不同公式在生物学研究中的差异。

下面我们来详细看看研究的结果。

1. 双位点上位性:加法、乘法和嵌合公式的比较


在研究双位点上位性时,研究人员考虑了单倍体基因组(haploid genome,只含有一组染色体的基因组),假设每个基因座有两个等位基因,分别标记为 0 和 1 。这样就有四种可能的基因型:野生型 00、单突变体 01 和 10、双突变体 11,每种基因型都有对应的适应性值。在实际研究中,由于适应性值无法直接测量,通常会通过测量与适应性高度相关的性状来间接估计。常用的零假设模型(null model,用于对比实际数据,判断是否存在相互作用的模型)有加法模型和乘法模型。加法模型假设突变对适应性有累加效应,乘法模型则假设突变具有相乘效应。然而,还有一种广泛使用的嵌合公式,它在乘法适应性模型的框架下,用加法尺度来衡量与预期值的偏差。研究人员发现,嵌合公式和乘法公式虽然在计算双位点上位性时数值不同,但它们得出的相互作用符号总是一致的。不过,当适应性值与 1 相差较大时,嵌合公式可能会高估或低估双位点相互作用的强度。

2. 高阶上位性


随着研究深入到三位点及以上的高阶上位性,研究人员发现问题变得更加复杂。在乘法适应性模型下,三位点上位性的乘法公式和嵌合公式差异显著,不仅数值不同,符号也可能不一样。研究人员通过模拟实验发现,约 28% 的三位点组合在这两个公式下的相互作用符号不同。对于四位点和五位点的相互作用,这种差异更为明显,只有约 57% 和 52% 的相互作用在两个公式下符号相同。这表明,在研究高阶上位性时,使用不同的公式可能会得出截然不同的结论,严重影响研究结果的准确性。

3. 用多元伯努利分布统一上位性测量


为了深入理解这些差异,研究人员引入了多元伯努利分布。他们将基因型看作是符合多元伯努利分布的随机变量,通过证明得出,加法、乘法和嵌合上位性测量以及沃尔什系数(Walsh coefficients,一种用于测量背景平均上位性的系数)都对应着多元伯努利分布的不同参数化形式。其中,乘法上位性测量对应着自然参数,加法上位性测量在特定假设下也与自然参数相关,而嵌合上位性测量则对应着联合累积量(joint cumulants,一种用于衡量随机变量高阶相互作用的概念)。但联合累积量并不适合用于测量二进制随机变量(如基因座上的突变状态)的高阶相互作用,而且假设适应性值等同于多元伯努利随机变量的矩(moments)在生物学上对于高阶相互作用来说也不合理,这就解释了为什么嵌合公式在高阶上位性测量中存在问题。

4. 基于乘法适应性模型的模拟


研究人员通过模拟实验进一步验证了他们的发现。在模拟实验中,他们按照乘法适应性模型生成不同位点的适应性值,并加入高斯噪声。结果发现,对于双位点相互作用,乘法测量和嵌合测量的符号与真实相互作用参数的符号匹配情况相似,但对于高阶相互作用,嵌合测量的符号错误率更高。而且,在测量相互作用强度时,乘法测量的误差始终小于嵌合测量,这再次证明了在乘法适应性模型下,乘法测量比嵌合测量更准确。

5. 基于 NK 模型的模拟


研究人员还使用了 NK 模型进行模拟。NK 模型可以模拟具有不同 “崎岖度” 的适应性景观。研究发现,嵌合测量会错误地指示出模拟适应性景观中不存在的高阶相互作用,而乘法测量则不会出现这种情况。例如,当适应性景观只包含双位点相互作用时,三位点乘法上位性测量值应为零,但嵌合测量值却可能非零,这表明嵌合测量容易产生误判,干扰对真实遗传相互作用的判断。

6. 酵母中的三位点上位性


研究人员重新分析了酵母中两个三基因缺失研究的数据,以探究使用嵌合上位性测量和乘法上位性测量对生物学解释的影响。这些研究使用了三突变体合成遗传阵列技术来测量不同突变体的适应性,原本采用了乘法适应性模型,但计算上位性时用的是嵌合公式。研究人员重新计算了乘法上位性测量值,发现约 12% 的基因三联体在两种测量方法下的相互作用符号不同,尤其是在负相互作用方面差异明显。通过乘法测量发现的许多负相互作用基因三联体,在功能冗余(functional redundancy,指多个基因或蛋白质具有相似功能,一个基因的缺失或失活可由其他基因补偿)相关特征上显著富集,这意味着使用乘法公式能发现更多具有生物学意义的高阶遗传相互作用,而嵌合公式可能会遗漏这些重要信息。

7. 药物反应中的高阶相互作用


在分析药物反应数据集时,研究人员比较了嵌合上位性测量和加法上位性测量的差异。该数据集研究了大肠杆菌在多种抗生素组合下的反应,之前使用嵌合公式来识别抗生素之间的高阶相互作用。研究发现,对于三、四、五位点的相互作用,两种测量方法的符号不一致,且差异随着相互作用阶数的增加而增大。例如,在一些五位点抗生素组合中,嵌合测量认为是拮抗作用(antagonistic,联合使用效果不如单独使用),但加法测量却认为是协同作用(synergistic,联合使用效果更好),这表明不同的测量方法会导致对药物相互作用类型的判断出现偏差,影响对药物组合效果的评估。

8. 蛋白质突变之间的上位性


研究人员利用 11 种不同蛋白质的深度突变扫描实验数据,进一步比较了乘法和嵌合上位性测量的差异。结果发现,对于许多蛋白质,这两种测量方法在量化高阶上位性时存在很大分歧。而且,它们之间的相关性和符号不一致率会随着适应性值标准差的变化而变化。以大肠杆菌的 FolA 代谢蛋白和化脓性链球菌的 SpCas9 核酸酶为例,这两种蛋白质的适应性值标准差较大,在高阶相互作用测量中,乘法和嵌合测量的相关性很低,符号不一致率很高,这说明在蛋白质研究中,使用不同的上位性测量方法会得出差异巨大的结果,影响对蛋白质突变相互作用的理解。

综合以上研究结果,研究人员在讨论部分指出,遗传变异、药物和其他扰动之间的高阶相互作用对塑造生物体的适应性景观至关重要。然而,目前文献中用于测量高阶上位性的公式存在多种且不一致的情况,特别是嵌合公式,它在统计上不够合理,容易导致错误的生物学结论。通过本研究,揭示了不同上位性测量公式与多元伯努利分布的关系,明确了乘法和加法公式在测量高阶上位性时更具数学合理性和生物学意义。这一研究成果为未来在遗传学、药物反应、蛋白质适应性景观等领域的研究提供了重要的理论基础和方法指导,提醒研究人员在研究高阶相互作用时,应谨慎选择合适的测量公式,避免因公式选择不当而得出错误结论,从而推动相关领域的研究朝着更准确、更深入的方向发展。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号