“万丰” 巴旦木染色体水平基因组组装:开启中国本土巴旦木分子育种新征程

【字体: 时间:2025年01月31日 来源:Scientific Data 5.8

编辑推荐:

  为解决中国本土巴旦木(Prunus dulcis)品种基因组测序与组装的空白问题,研究人员开展 “万丰” 巴旦木染色体水平基因组组装研究。结果获得 288.53 Mb 基因组,注释 24,230 个蛋白编码基因。这为中国本土巴旦木分子育种提供重要遗传资源。

  巴旦木,作为世界四大干果之一,在全球广泛种植,经济价值颇高。在中国,巴旦木的栽培历史可追溯至唐朝,新疆喀什地区更是拥有丰富的巴旦木资源,像 “万丰” 等多个品种在此繁衍。然而,欧美相关研究机构已对 “Lauranne”“Texas”“Nonpareil” 等巴旦木品种完成基因组测序与组装,而中国本土巴旦木品种在这方面却处于空白状态。这一现状限制了中国巴旦木的分子育种研究,无法深入挖掘本土品种的优良基因,也难以培育出更适应本土环境、具有更高经济价值的新品种。
为填补这一空白,新疆农业大学园艺学院以及中国农业科学院西部农业研究中心的研究人员开启了对 “万丰” 巴旦木的基因组研究之旅。他们的研究成果发表在《Scientific Data》上,为中国巴旦木产业的发展带来了新的曙光。

研究人员采用了多种先进的技术方法。首先,通过 DNBSEQ - T7 平台对 “万丰” 巴旦木叶进行测序,获取 50.29 Gb 二代原始数据,利用 K - mer 分析预测基因组大小等信息。接着,借助 PacBio Sequel II 测序平台获得 HiFi 数据用于基因组从头组装,再结合 Hi - C 测序数据将基因组组装提升至染色体水平。同时,运用多种软件和数据库进行基因注释、重复序列分析等工作。

研究结果主要包括以下几个方面:

  • 基因组组装:“万丰” 巴旦木基因组大小为 288.53 Mb,contig N50达 30.48 Mb,scaffold N50为 31.36 Mb,约 270 Mb 序列锚定在 8 条超级 scaffolds 上。通过 BUSCO 评估发现,该基因组组装包含 99.3% 完整的 BUSCOs(Benchmarking Universal Single - Copy Orthologs,用于评估基因组组装完整性的单拷贝直系同源基因集),这表明基因组组装的完整性和准确性较高。
  • 基因注释:共预测出 24,230 个蛋白编码基因,其中 24,033 个具有功能。研究人员在 InterPro、Gene Ontology(GO,基因本体论,用于描述基因功能、细胞组分和生物学过程的标准词汇库)、Kyoto Encyclopedia of genes and Genomes(KEGG,京都基因与基因组百科全书,整合了基因组、化学和系统功能信息的数据库)等五个数据库中对这些基因进行功能和结构域注释,为深入了解基因功能奠定基础。
  • 非编码 RNA 鉴定:还鉴定出 225 个 miRNAs(微小 RNA,一类内源性非编码小 RNA,可调控基因表达)、530 个 tRNAs(转运 RNA,在蛋白质合成过程中运输氨基酸)、7,669 个 rRNAs(核糖体 RNA,构成核糖体的重要组成部分)和 816 个 snRNAs(小核 RNA,参与真核生物细胞核内 RNA 的加工)等非编码 RNA,这些非编码 RNA 在基因表达调控等方面发挥着重要作用。
  • 重复序列分析:基因组中约 60.51% 为重复序列,其中长末端重复(Long terminal repeat,LTR)转座子占总基因组的 44.22%,DNA 转座子占 11.44%。重复序列的分析有助于了解基因组的进化和结构。

研究结论和讨论部分强调了该研究的重要意义。“万丰” 巴旦木高质量染色体水平基因组的成功组装,为中国本土巴旦木的分子育种提供了宝贵的遗传资源。这使得研究人员能够深入研究巴旦木的遗传特性,挖掘与优良性状相关的基因,通过基因编辑等技术手段培育出更具优势的新品种,提高巴旦木的产量、品质和抗逆性,推动中国巴旦木产业的可持续发展。同时,该研究成果也为其他果树基因组研究提供了参考和借鉴,促进了植物基因组学领域的发展。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号