德国洋甘菊(Matricaria chamomilla)基因组测序成果:解锁药用植物遗传密码

【字体: 时间:2025年03月01日 来源:Scientific Data 5.8

编辑推荐:

  为获洋甘菊基因组序列,研究人员测序分析,得到高质量基因组及单倍型序列,助力相关研究。

  德国洋甘菊(Matricaria chamomilla),作为全球闻名的药用植物,在皮肤感染、胃肠道疾病、呼吸道问题等治疗方面发挥着重要作用。它属于菊科(Asteraceae),是主要的异交物种,基因组高度杂合,而且其基因型既有二倍体又有四倍体,这使得洋甘菊的遗传学研究困难重重。尽管洋甘菊应用广泛,但此前一直没有参考基因组,严重限制了对其遗传机制的深入探索,也阻碍了相关育种和药用成分开发等研究的进展。
为了填补这一空白,莱布尼茨植物遗传学和作物植物研究所以及首尔国立大学等机构的研究人员展开了深入研究。他们的研究成果发表在《Scientific Data》上,为洋甘菊及菊科相关植物的遗传学和基因组学研究提供了重要资源。

在这项研究中,研究人员运用了多种关键技术方法。首先,他们选取了洋甘菊品种‘Bona’的单株二倍体进行研究。通过 PacBio HiFi 和 Hi-C 测序技术获取数据,再利用 TRITEX 管道对数据进行组装分析。PacBio HiFi 技术能够提供高精度的长读长序列,Hi-C 技术则有助于确定染色体的空间构象,二者结合为准确组装基因组奠定了基础。

研究结果如下:

  1. 基因组大小估计:研究人员通过计算 HiFi 数据的 k-mer,利用 Jellyfish 和 findGSE 等工具估计洋甘菊基因组大小约为 2.73Gb,杂合率为 1.2%,重复率为 41%,并通过 GenomeScope 分析确认其为二倍体。
  2. 伪单倍体基因组组装:使用 TRITEX 长读长组装管道,结合 Hi-C 和 HiFi 读数进行重叠群(contig)组装,得到 2662 个 contig,经过筛选和手动整理后,最终组装成 2541 个支架(scaffold),N50 达到 285Mb。其中 92 个 contig 被锚定到 9 条染色体上,总长度为 2.60Gb,占总 contig 组装的 94.6% 。
  3. 单倍型解析组装:以 hifiasm 得到的单位体(unitig)组装为基础进行单倍型解析组装。单位体组装包含 28889 个 unitig,其中 79% 被定位到 9 条染色体用于单倍型定相。最终得到两个单倍型组装,大小分别为 2.28Gb 和 2.34Gb,分别覆盖伪单倍体参考基因组的 87.6% 和 89.8% 。
  4. 伪单倍体组装基因注释:使用 EDTA v2.0.0 程序注释重复 DNA,发现 2.75Gb 序列中 73.17% 为重复序列,其中长末端重复(LTR)元件占 72.49%,包括 Copia 和 Gypsy 元件等。利用 BRAKER2 结合 RNA-Seq 证据注释蛋白质编码基因,经筛选后得到 215439 个基因,其中 47820 个基因通过同源性比对在 TAIR 数据库中获得功能注释。
  5. 数据记录与验证:PacBio 和 Hi-C 原始读数、基因组组装序列以及基因注释文件等数据均已存储在相应数据库,方便其他研究人员获取使用。通过 BUSCO 评估,基因组组装的基因空间完整性为 98.8%,功能注释基因集的完整性为 94.6%。通过绘制共线性图和检查 Hi-C 接触矩阵,评估了单倍型定相组装的准确性。

研究结论表明,研究人员成功获得了高质量的德国洋甘菊二倍体伪单倍型序列组装和单倍型解析基因组序列。这些基因组序列为洋甘菊的遗传学研究提供了重要基础,有助于深入了解洋甘菊的遗传特性、进化关系以及药用成分的合成途径等。同时,也为菊科其他植物的基因组研究提供了参考,在植物育种、药用植物开发等领域具有重要的应用价值。例如,为培育更优良的洋甘菊品种提供了遗传信息,有望提高洋甘菊的药用成分含量和品质。不过,目前的研究虽然取得了重大突破,但洋甘菊复杂的基因组仍有许多未知等待进一步探索,后续研究可基于这些基因组序列深入挖掘更多功能基因及其调控机制,推动洋甘菊相关产业的发展。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号