HiFi测序揭示当归背后的秘密

【字体: 时间:2022年12月13日 来源:基因有限公司

编辑推荐:

  来自中国农业科学院的王丽课题组使用HiFi测序技术组建了一个高质量的中华当归基因组。

当归,又名女人参,最早记载于中国汉代《神农百草经》“当归,味甘、辛、温,无毒。主咳逆上气,温疟寒热,洗在皮肤中,妇人漏下、绝子,诸恶疮疡,金疮,煮饮之。温中止痛,除客血,内塞,中风痉,汗不出,湿痹,中恶客气,虚冷,补五脏,生肌肉”。当归的主要活性成分被认为是香豆素,香豆素不仅影响着植物的生长发育,并有抗炎抗肿瘤等药理活性。香豆素已被证明是通过植物体内的苯丙烷类合成途径产生,但是香豆素生物合成途径中合成基因和转录因子的调控网络尚不清楚。

来自中国农业科学院的王丽课题组,于2022年10月发表在The Plant Journal上的文章The chromosome-level genome of female ginseng (Angelica sinensis) provides insights into molecular mechanisms and evolution of coumarin biosynthesis,使用HiFi测序技术组建了一个高质量的中华当归基因组。基于此基因组数据,研究人员对伞形科(当归属于伞形科芹亚科当归属)植物进行了全面的系统基因组研究。然后通过转录组学和代谢组学分析筛选到了一系列基因,包括简单香豆素生物合成途径中的结构基因和转录因子。

以HiFi测序为代表的三代测序技术,突破了二代测序GC偏好性及短读长对植物基因组组装的限制,HiFi reads(High Fidelity  reads)基于环形一致性测序(Circular Consensus Sequencing,CCS)模式,产生出既有较长的读长(最长可达25kb的长度),又具有很高的序列精度(约99.9%准确率)的测序结果。这一技术对于基因组组装具有重要意义。不仅提高了组装效率、准确率,更重要的是能够实现gap free组装,构建真正意义上的完整基因组图谱。

细节揭秘

1、构建当归基因组

研究人员使用HiFi测序技术获得了28.9X,约60.45Gb的数据,结合Hi-C数据对当归基因组进行组装。最终组装了2.37Gb的当归基因组,由1902个Scaffold组成,Scaffold N50为193.87Mb,如表1所示。双端RNA-seq映射基因组分析,BUSCO分析和LAI指数评估,都显示组装的当归基因组具有较高质量。由该基因组组装数据可以窥见一隅以HiFi测序技术在基因组组装上的表现。超长的读长带来的不仅仅是组装的方便快捷,更多的是覆盖难测区域的优势。例如,当归基因组部分区域GC含量较高,并且含有串联重复序列等难测区域,尽管如此,也没有影响HiFi测序的覆盖度,如图1所示。建立高质量的当归基因组,并对基因组进行注释,为后续当归的系统基因组学研究与香豆素合成通路研究奠定了坚实的基础!


表1. 当归基因组组装详情


图1.当归的基因组特征。染色体(A)、基因密度(B)、重复序列密度(C)、GC含量(D),
环状图中心的每条连接线表示一对同源基因(E)。

2、当归的系统发育

研究人员将当归和其余5种伞形目伞形科的植物,1种伞形目五加科的植物,2种其他目植物的基因组进行对比并构建系统发育树,如图2所示。同时对这9种植物的基因家族进行扩张和收缩分析,当归的基因家族扩张了989个,GO和KEGG分析显示扩张的基因主要富集在光合作用通路以及此生代谢产物合成通路。这次出现在当归中的基因家族扩张事件在其次生代谢产物丰富过程中至关重要。


图2.九种植物的系统发育树及基因家族的扩展/收缩

紧接着,研究人员分析了发生在当归中的全基因组复制事件。全基因组复制事件(WGD)被认为是物种分化的动力,并且在植物中发生的十分频繁。通过分析Ks值的分布,研究人员发现了一次发生在伞形目的WGD事件,以及一次仅发生在伞形目伞形科的WGD事件。此伞形科特有的WGD事件产生的复制基因的GO分析表明这些基因和植物生长发育和根系形态发生相关。

然后,研究人员在构建的当归基因组中鉴定到了33925个重复基因,其中2813个串联重复基因(TD)。基因富集分析结果显示,TD事件在次生代谢物的合成中起着关键作用,特别是一些涉及苯丙烷类生物合成的代谢物,如图3所示。TD事件与当归基因家族的扩张有关。WGD加速了伞形科的物种多样性,随后的TD促进了次生代谢产物的产生,从而增强了物种多样性扩大的地方适应性。


图3.基因富集分析。(a)GO分析。(b)KEGG分析。

3、简单香豆素合成及调控网络构建

高质量的参考基因组使研究人员能够重建简单香豆素生物合成的代谢途径,特别是识别参与该过程的关键酶基因。研究人员鉴定了81个可能参与简单香豆素生物合成的酶基因。为了缩小简单香豆素生物合成途径的候选基因数量,研究人员计算了上述基因表达水平与四种代谢物含量(伞形酮、秦皮乙素、东莨菪素、阿魏酸)的相关系数。其中46个基因与至少一种代谢物呈显著正相关,可能参与了简单香豆素的生物合成,如图4所示。为了进一步识别调节简单香豆素生物合成的转录因子,研究人员构建了一个基因共表达网络,并评估了共表达基因模块与检测的代谢物含量之间的相关性。共鉴定出174个调控转录因子,如图5所示。这些转录因子可作为基因修饰的潜在位点,促进香豆素的生物合成。


图4.香豆素生物合成途径。绿圈、红圈、蓝圈、黄圈分别与伞形酮、秦皮乙素、东莨菪素、阿魏酸呈显著正相关。


图5.相关基因与四种代谢物的加权基因共表达网络分析

4、参与香豆素合成的异戊烯基转移酶(PT)进化历史

在简单香豆素生物合成途径中,伞形酮通过PT转化为呋喃香豆素。研究人员使用来自24个植物基因组的295个PT基因,按照WGD和TD区别构建系统基因组网络,绘制了PT基因家族的进化史,如图6所示。最初,在种子植物的共同祖先中存在一个原始的PT基因,并通过一个古老的TD扩展形成两个分支。这两个分支分别经历了种子植物和被子植物共有的两个WGD事件。PT基因在桑科、豆科、芸香科和伞形科中独立进化,是被子植物和裸子植物分化后的产物。PT的进化历史可以为研究植物防御的进化机制提供一个极好的模型。


图6.PT基因家族的进化历史

总结

该文章建立在HiFi测序组装的基因组上的研究,所开发的基因组资源将有助于有效的种质资源探索、比较基因组学和功能基因组学研究,以及改进当归的药用价值,特别是探索植物中生物活性分子的特异性产生。

基因有限公司作为PacBio公司在中国区的独家代理商,自2011年以来将PacBio第三代单分子实时测序技术引入国内,一直为国内用户提供专业的三代测序系统的安装培训,技术支持,应用培训与售后维护工作,赢得客户的一致好评与信任。基因有限公司将一如既往的支持越来越多的PacBio用户。

订阅生物通快讯

订阅快讯:

最新文章

限时促销

会展信息

关注订阅号/掌握最新资讯

今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 仪器云展台 | 实验云展厅 | 云讲堂直播 | 会展中心 | 特价专栏 | 免费试用 | 有奖调研

版权所有 生物通

Copyright© eBiotrade.com, All Rights Reserved

联系信箱:

粤ICP备09063491号