GC含量异常?华大0PCR测序方案轻松解决

【字体: 时间:2019年10月06日 来源:华大科技

编辑推荐:

  哪些情况特别需要用到0PCR测序方案呢? 其实很简单,哪些物种的基因组或基因组上哪些区域最可能富含GC或者AT,就最可能产生PCR的扩增偏向,采用0PCR技术的效果也就最好。

前情提要

科技君之前发过的文章提到了0PCR测序方案,它结合了PCR free建库技术和DNBSEQTM测序技术,最大化降低了PCR 扩增可能引入的错误和偏向性。这种测序方案除了能够检测到更多的真实InDel,还能带来更高的基因组覆盖均一性,对高GC、中GC、低GC含量的物种测序覆盖均一性表现良好(图1、图2、图3)。(还没看过的小伙伴戳这里~)


图1 GC含量62%的细菌(Olsenella Profusa)测序结果GC偏向性统计结果


图2 GC含量50%的细菌(E.coli)测序结果GC偏向性统计结果


图3 GC含量38%的细菌(Bacillus megaterium)测序结果GC偏向性统计结果

注:数据来源于3 种不同GC 含量的细菌30X测序。上图以100个碱基的大小为窗口,绘制GC 含量分布图。灰色水平线表示理想的归一化覆盖度,表示为1.0,蓝色点线表示样本的实际归一化的覆盖度。蓝色点线约接近1.0,说明样本的基因组覆盖均一性越好。

那么,哪些情况特别需要用到0PCR测序方案呢? 其实很简单,哪些物种的基因组或基因组上哪些区域最可能富含GC或者AT,就最可能产生PCR的扩增偏向,采用0PCR技术的效果也就最好。

今天科技君就为大家整理了那些富含GC或者AT的物种基因组,以及基因组上一些特殊的区域。

富含GC/AT的物种占比约40%

GC含量是DNA中鸟嘌呤(G)与胞嘧啶(C)所占的比例。一般来说,物种或某一基因的GC含量<35%或>65%即被认为是GC含量异常。

物种GC含量异常在自然界中十分常见。原核生物中,变形菌Candidatus Zinderia基因组的GC含量低至13.5%,而放线菌Streptomyces rubrolavendulae的GC含量高达74.8%。真核生物中,恶性疟原虫(Plasmodium falciparum)基因组的GC含量为19.3%,是迄今已知GC含量最低的真核生物。而褐潮藻类(Aureococcus anophagefferens)的GC含量高达67.4%。


图4 常见的GC含量异常物种[1]

小RNA序列的GC含量较其侧翼序列高

一般来说,编码序列的GC含量较高,而非编码序列的GC含量较低,这也是基因注释软件算法的参考因素之一[1]。

研究小鼠和拟南芥的小RNA序列发现,无论是基因组还是转录本,小RNA序列的GC含量高于其侧翼序列,且高于物种基因组的平均GC含量(拟南芥:36.05%;小鼠:41.89%)。


图5 不同物种中,小RNA编码区序列与侧翼序列的GC含量变化[2](A)拟南芥基因组(B)拟南芥转录本(C)小鼠基因组(D)小鼠转录本

横坐标中“0”表示小RNA序列与侧翼序列的交界,负值表示小RNA中某一位置与这个交界的距离,正值则表示侧翼序列中某一位置与该交界的距离。

某些微卫星DNA上GC含量偏低

微卫星DNA在真核生物基因组中多有分布,多为串联重复序列,重复单位长度为2-6 bp,重复次数一般为10-60次。微卫星DNA作为遗传标记,被广泛应用于遗传杂交育种和绘制染色体遗传图谱等领域。AT/TA串联重复序列的存在使得某些微卫星DNA序列GC含量偏低。

特殊mRNA某些区域的GC含量可能较高

与转录后调控相关的基因,基因上的某些区域GC含量可能偏高。

UPF1蛋白是一种RNA解旋酶,能够与目标mRNA 3’UTR区域结合从而降解目标mRNA,在基因的转录后调控中发挥重要的作用。研究发现,正常的mRNA的3’UTR区域的GC占比约43%(与人基因组的GC含量相似),但与UPF1蛋白结合的mRNA,其 3’UTR区域的GC含量却高达57%(图6)。


图6 不同的人类细胞系(HEK293、K562)中与UPF1蛋白结合的mRNA(UPF1, HEK293、UPF1, K562)与其他mRNA(All mRNAs) 在3’非翻译区(3’UTR)碱基含量的分布[1]

锌指蛋白basonuclin在多种鳞状上皮组织中表达,可能是分化细胞特有的一种转录因子[5]。锌指蛋白basonuclin mRNA的5’UTR区含有约180 bp的高GC含量区域,能够发生自身碱基互补,形成二级结构,影响该蛋白的正常表达,从而影响细胞的生理生化活动(图7)。


图7 锌指蛋白basonuclin mRNA 5’UTR区的二级结构(部分)[4]

CpG岛富含GC

要问基因组上什么区域的GC含量最高的话,非CpG岛莫属。CpG岛富含CpG二核苷酸,主要位于基因的启动子和外显子区域。

DNA甲基化是指在DNA甲基化转移酶的作用下,胞嘧啶上结合一个甲基基团。因此,高GC含量的CpG岛是DNA甲基化的高发区域。DNA发生甲基化后,无法正常转录,相关基因的表达会被抑制。另外,发生了甲基化的DNA可以发生去甲基化,降低甲基化胞嘧啶的含量,使得基因正常表达[1]。

已有大量的研究表明,白血病、乳腺癌、结直肠癌等癌症的发生与DNA的甲基化/去甲基化修饰有关(图8)。


图8 基因的甲基化/去甲基化与癌症的关系[6-8]

总的来说,GC含量异常的现象在自然界中十分常见。0PCR测序方案对GC含量异常的基因组测序表现出色,避免PCR扩增带来的偏向性,能够提高GC含量异常区域覆盖的均一性,从多重维度还原基因组真相,是科研的不二选择!

参考文献:

[1] 杨焕明. 基因组学[M]. 北京:科学出版社,2016.10

[2] Zhang, Yu, Yan, Chenghuan and Kuang, Hanhui (2014), GC content fluctuation around plant small RNA-generating sites, FEBS Letters, 588

[3] Imamachi N, Salam KA, Suzuki Y, Akimitsu N. A GC-rich sequence feature in the 3' UTR directs UPF1-dependent mRNA decay in mammalian cells. Genome Res. 2017;27(3):407–418.

[4] Tang W, Tseng H. A GC-rich sequence within the 5' untranslated region of human basonuclin mRNA inhibits its translation[J]. Gene, 1999, 237(1):35.

[5] Tian Q. Function of basonuclin in increasing transcription of the ribosomal RNA genes during mouse oogenesis[J]. Development, 2001, 128(3):407-416.

[6] Watt P M, Kumar R, Kees U R. Promoter demethylation accompanies reactivation of theHOX11 proto-oncogene in leukemia[J]. Genes Chromosomes and Cancer, 2000, 29(4):371-377.

[7] Deboukijoudi S, Trifa F, Khabir A, et al. CpG methylation of APC promoter 1A in sporadic and familial breast cancer patients[J]. Cancer Biomarkers, 2016, 18(2):1-9.

[8] Murai M, Toyota M, Suzuki H, et al. Aberrant methylation and silencing of the BNIP3 gene in colorectal and gastric cancer[J]. Clinical Cancer Research, 2005, 11(3):1021-1027.

订阅生物通快讯

订阅快讯:

最新文章

限时促销

会展信息

关注订阅号/掌握最新资讯

今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

版权所有 生物通

Copyright© eBiotrade.com, All Rights Reserved

联系信箱:

粤ICP备09063491号