编辑推荐:
樱桃产业面临气候变化挑战,传统砧木育种进展缓慢。本研究利用 PacBio HiFi 和 Hi-C 技术,完成马哈利樱桃(P. mahaleb)染色体级单倍型基因组组装(A:272.64 Mb,B:271.76 Mb),鉴定基因、重复元件及非编码 RNA,揭示两单倍型约 267 万年前分化,为分子育种和进化研究奠定基础。
樱桃(Prunus subg. Cerasus)作为全球重要的经济果树,其砧木的抗逆性直接影响产业可持续发展。当前,气候变化导致极端天气频发,传统樱桃砧木育种因遗传基础模糊、关键基因定位困难,难以满足抗逆改良需求。马哈利樱桃(P. mahaleb)虽因耐寒、耐旱、耐盐等特性被广泛用作中亚地区樱桃砧木,但其基因组信息缺失,限制了分子设计育种的开展。此外,现有樱桃属基因组多为低质量组装(如 P. fruticosa 仅为 contig 水平),缺乏单倍型分辨率的染色体级参考基因组,难以解析种内遗传多样性和进化历程。因此,构建马哈利樱桃高质量基因组,揭示其抗逆遗传基础和进化地位,成为突破樱桃砧木育种瓶颈的关键。
为解决上述问题,南京林业大学联合中国农业科学院深圳农业基因组研究所等机构的研究人员,开展了马哈利樱桃单倍型分辨的染色体水平基因组组装研究。团队利用 PacBio HiFi 长读长测序和 Hi-C 染色体构象捕获技术,成功构建了两个单倍型基因组(Haplotype A:272.64 Mb,Contig N50=26.60 Mb;Haplotype B:271.76 Mb,Contig N50=30.26 Mb),并锚定到 16 条假染色体(2n=16),与核型一致。研究成果发表于《Scientific Data》。
研究采用的关键技术包括:
- PacBio HiFi 测序:获取 29.47 Gb 高保真长读长数据(54.1× 覆盖),用于基因组组装。
- Hi-C 技术:通过 39.37 Gb Hi-C 数据(72.3× 覆盖)将 contig 挂载到染色体,实现单倍型分型。
- 转录组测序(RNA-seq):利用 29.8 Gb 数据辅助基因结构预测和功能注释。
- 生物信息学分析:结合 BUSCO 评估基因组完整性(A:98.0%,B:98.1%),通过 EDTA 注释重复元件,Infernal 识别非编码 RNA,OrthoFinder 构建系统发育树。
研究结果
1. 基因组组装与单倍型特征
- 两个单倍型共包含 544.40 Mb 序列,GC 含量 37.92%,注释到 27,965(A)和 27,931(B)个蛋白编码基因,其中 98.79% 和 98.84% 获得功能注释(如 GO、KEGG、Swiss-Prot 数据库)。
- 重复元件占基因组 53% 以上,主要为长末端重复序列(LTR)和 DNA 转座子(TIR),A、B 单倍型分别含 145.64 Mb 和 144.04 Mb 重复序列。
- 非编码 RNA 注释揭示 4,262 个 rRNA、872 个 tRNA 及 1,514 个其他 ncRNA,两类单倍型在 rRNA 数量上存在显著差异(A:2,263 vs B:1,999)。
2. 单倍型分化与结构变异
- 系统发育分析显示,两单倍型约在 267 万年前(MYA)分化,LTR 插入时间峰值分别为 0.2214 MYA(A)和 0.2709 MYA(B),提示转座子活动可能驱动遗传多样性。
- 结构变异分析检测到 405 个共线性区域(226 Mb)、37 个倒位(5 Mb)及数千个易位和重复事件,染色体 2 和 4 存在大片段倒位,可能与适应性进化相关。
3. 进化地位与抗逆基因组基础
- 马哈利樱桃作为樱桃亚属基部类群,其基因组为解析樱桃属进化提供关键参考。与近缘种(如 P. avium、P. cerasus)的 orthogroup 分析显示,共存在 10,802 个核心基因家族,揭示樱桃属保守遗传基础。
- 抗逆相关基因家族(如胁迫响应转录因子、渗透调节蛋白)的扩张与特异性表达,为解析其耐寒、耐旱机制提供候选靶点。
研究结论与意义
本研究首次提供樱桃亚属基部类群的单倍型分辨染色体级基因组,填补了马哈利樱桃基因组空白。高质量基因组不仅为分子标记开发、抗逆基因克隆及砧木分子设计育种提供关键工具,还通过单倍型比较和进化分析,揭示了樱桃属基因组动态演化规律。研究结果将加速樱桃抗逆砧木的定向改良,助力应对气候变化对果树产业的挑战,同时为蔷薇科植物基因组学和进化生物学研究提供重要参考。