首次解析黄刺玫染色体级参考基因组,为蔷薇属研究开辟新前沿

【字体: 时间:2025年02月16日 来源:Scientific Data 5.8

编辑推荐:

  为解决野生蔷薇研究受限问题,中国科学院成都生物研究所研究人员开展黄刺玫染色体级参考基因组研究,成功组装其基因组并完成注释。该成果为蔷薇属遗传学研究等提供关键支撑,强烈推荐科研读者阅读。

  
中国科学院成都生物研究所(Chengdu Institute of Biology, Chinese Academy of Sciences)的研究人员 Zhenlong Liang、Jia Miao、Hengning Deng 等人在《Scientific Data》期刊上发表了题为 “A chromosomal-scale reference genome for Rosa hugonis” 的论文。这篇论文在蔷薇属植物研究领域意义重大,为深入探究蔷薇属植物的遗传学、物种关系以及开发利用提供了关键的遗传信息基础。

研究背景


蔷薇属(Rosa)隶属蔷薇科(Rosaceae),包含 150 - 200 种植物,广泛分布于北半球的温带和亚热带地区。蔷薇不仅具有极高的观赏价值,例如月季(R. chinensis)是现代观赏玫瑰品种的重要亲本;还富含精油、单宁、黄酮类和酚酸等生物活性化合物,在食品、化妆品和制药行业应用广泛。然而,目前仅有部分蔷薇基因组被测序报道,包括 8 个园艺品种和 2 个野生种,高质量参考基因组的缺乏严重限制了对野生蔷薇物种在育种、栽培和利用方面的深入研究。

黄刺玫(Rosa hugonis Hemsl.)是一种多年生灌木,在中国西部和北部的许多省份广泛分布。已有研究表明,黄刺玫对大气悬浮颗粒有滞留作用,具备空气净化潜力;其生态适应性和种群更新能力强,适合用于干旱河谷的生态修复;还可作为玫瑰嫁接的合适砧木。此外,黄刺玫花瓣香气成分多样,花瓣提取物中的酚类化合物具有神经保护作用。但由于缺乏高质量基因组,进一步的研究进展受阻。

研究方法


  1. 植物材料与多倍体估计:研究人员将采自四川省茂县(纬度:103.692792,经度:31.520581,海拔:1,625 米)的野生黄刺玫移栽至中国科学院成都生物研究所的温室中培养。通过观察新生根的染色体数目来确定黄刺玫的倍性。具体操作是将收集的根浸泡在 0.002 M/L 的 8 - 羟基喹啉水溶液中,15℃恒温处理 3 - 4 小时,随后用卡诺氏固定液固定 0.5 - 24 小时,在 60°C 的 1 N HCl 中软化 5 分钟,最后用改良苯酚品红染色并压片,借助奥林巴斯显微镜(Olympus microscope)观察有丝分裂中期细胞并拍照。结果显示,黄刺玫为二倍体,有丝分裂中期含 14 条染色体。
  2. DNA 提取与测序:从成熟的黄刺玫植株上采集新鲜幼叶,送往北京百迈客生物科技有限公司(Berry Genomics Company)进行基因组测序。采用 CTAB 法提取高质量基因组 DNA,利用 NanoDrop 2000 分光光度计、琼脂糖凝胶电泳和 Qubit 3.0 荧光计对 DNA 质量和浓度进行评估。使用 SMRTbell Express Template Prep Kit 2.0 构建 15 kb 文库,经安捷伦 2100 生物分析仪(Agilent 2100 Bioanalyzer system)评估后,在 PacBio Sequel II 平台上进行测序,并通过 PacBio SMRT - Analysis Link 进行原始聚合酶读取的质量控制。对于 Hi - C 测序,提取的 DNA 先与 2% 甲醛溶液交联以捕获相互作用的 DNA 片段,经 DpnII 限制性内切酶消化后,在 Illumina Novaseq 6000 平台上构建文库并测序。同时,采集黄刺玫的茎、叶和花等新鲜组织样本,液氮速冻后,用 RNAprep Pure Polysaccharide Polyphenols Plant Total RNA Extraction Kit 提取总 RNA,经质量评估后,在 Illumina Novaseq 6000 平台上进行转录组测序。
  3. 基因组组装与质量控制:利用 Hifiasm v0.15.228 软件,基于 CCS reads 生成初步组装结果。通过 minimap2 v2.13 将 CCS reads 比对到组装基因组序列,根据比对读数的覆盖分布和比对分数去除杂合重叠群;再用 minimap2 将剩余 reads 比对到去除杂合重叠群的基因组序列,去除平均覆盖深度小于 5× 的重叠群以排除潜在的假阳性重叠群。经抛光后,得到约 337.96 Mb 的重叠群组装,contig N50 值为 28.14 Mb。接着,制备 Hi - C 文库,去除低质量读数,利用 BWA 软件(集成在 Juicer v1.6.2 软件中)将过滤后的 Hi - C 读数比对到初始草图基因组,仅使用唯一比对且验证的双端读数,通过 3D - DNA pipeline 进行组装,并用 Juicebox v1.9.8 手动排序支架,最终获得染色体级别的组装。利用 BUSCO(Benchmarking Universal Single - Copy Orthologs)评估基因组组装的完整性,基于 embryophyta_odb10 数据库进行分析;使用 minimap2 v2.13 将 CCS 短读数映射到组装基因组序列,评估映射率。
  4. 基因组注释:使用 MITE - Hunter v1.0 识别基因组中的微型反向重复转座元件(MITEs);利用 LTRharvest 和 LTR Finder v1.07 检测长末端重复序列(LTRs),并用 LTR retriever v2.8.2 整合结果;借助 RepeatMasker v4.1.0 在 RepBase 数据库中搜索已知重复序列,通过 RepeatModeler v2.0 从头识别其他重复序列。采用从头预测、基于蛋白质的同源性搜索和 RNA 测序相结合的策略进行基因结构注释,使用多种软件预测基因结构、进行同源性预测、比对 RNA - Seq 读数和组装转录本,最终利用 EVidenceModeler v1.1.1 整合结果,并用 PASA 软件预测开放阅读框(ORF)和其他可变剪切注释。通过 BLAST 将所有预测的蛋白质编码基因(PCGs)比对到 NR、SwissProt 和 eggNOG 数据库进行功能注释,利用 InterPro 注释蛋白质结构域,从 InterPro 条目中获取基因本体(GO)术语,通过 BLAST 比对 KEGG 数据库确定基因参与的通路。此外,使用 tRNAscan - SE v2.0 预测 tRNA,利用 Rfam 数据库和 BLAST 注释其他非编码 RNA(ncRNA)。

研究结果


  1. 基因组组装统计:最终组装的黄刺玫基因组大小为 337.92 Mb,scaffold N50 长度为 26.84 Mb,共获得 49 个高质量 contig。将 331.31 Mb 的序列锚定到 7 条假染色体上,各假染色体的长度和包含的 contig 数量存在差异(表 2)。通过 BUSCO 评估,基因组完整性达 98.6%(单拷贝 BUSCOs 为 94.7%),CCS 短读数映射率为 99.96%。
  2. 基因组注释结果:黄刺玫基因组中重复序列占 48.8%,总量达 164.9 Mb,其中 LTRs 占 34.37%,DNA 转座子占 5.11%。在 LTRs 中,Gypsy 和 Copia 类型最为丰富,分别占 11.17% 和 10.67%。共预测到 36,218 个蛋白质编码基因(PCGs),基因结构相关统计信息表明,基因平均长度为 3,342 bp,每个基因平均有 1.1 个转录本,外显子和内含子的数量及长度也有相应特征(表 3)。功能注释显示,93.73%(33,946 个)的基因至少在一个数据库中有注释,13.69%(4,959 个)的基因在五个数据库中均有注释。此外,还鉴定出 702 个 rRNA、669 个 tRNA、105 个 miRNA、194 个 snRNA 和 470 个 snoRNA。

研究结论与讨论


本研究首次成功构建了黄刺玫染色体级别的高质量基因组组装,这一成果意义非凡。从基因组学角度来看,精确的基因组序列信息为深入研究黄刺玫的遗传特性提供了关键依据,有助于解析其在适应不良环境过程中的分子机制,例如其强适应性与特定基因或基因家族的关系。在物种进化研究方面,该基因组可作为重要参考,用于对比其他蔷薇属物种,进一步明确黄刺玫在蔷薇属中的进化地位,揭示蔷薇属植物的进化历程和遗传多样性形成机制。

对于实际应用,高质量基因组为黄刺玫在生态修复、园艺育种和化合物开发利用等领域开辟了新途径。在生态修复中,可基于基因组信息筛选具有更强环境适应能力的黄刺玫品种,提高干旱河谷等生态脆弱地区的修复效果;园艺育种方面,能帮助育种者更精准地选择亲本,培育出具有优良观赏性状、更强适应性的玫瑰新品种;在化合物开发利用上,有助于深入挖掘黄刺玫中生物活性化合物的合成途径,为食品、化妆品和制药行业提供更多创新原料和研发思路。

总之,该研究成果为蔷薇属植物的研究和开发利用搭建了重要平台,有望推动相关领域取得更多突破性进展,让黄刺玫这一植物资源在生态、经济和社会等多方面发挥更大价值。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号