编辑推荐:
琴叶榕(Ficus benjamina)缺乏参考基因组限制了分子研究。为此,研究人员利用 Illumina、PacBio 及 Hi-C 测序技术,完成其染色体级基因组组装(362.73 Mb,contig N50=25.76 Mb,BUSCO=98.10%),注释 28,840 个基因,为揭示其生态与园艺性状机制提供关键资源。
琴叶榕(Ficus benjamina),又称垂叶榕,是热带与亚热带生态系统的重要成员,因全年结果特性成为食果动物的关键食物来源,其与传粉榕小蜂的专性互利共生关系更是协同进化研究的经典模型。此外,作为全球广泛栽培的观赏植物,其多样的形态变异(如斑叶、扭曲枝条)具有重要园艺价值。然而,长期以来缺乏高质量参考基因组,严重制约了其生态功能(如碳汇能力、物种互作)和园艺性状(如抗逆性、株型发育)的分子机制研究,也阻碍了榕属植物基因组比较及进化历史的深入解析。
为填补这一空白,中国科学院华南植物园、广州林业和园林科学研究院等机构的研究团队,针对琴叶榕开展了染色体级基因组组装及功能注释研究。相关成果发表于《Scientific Data》,为榕属植物研究提供了关键基础数据。
研究采用多组学技术整合策略:
- 基因组测序:利用 Illumina NovaSeq X Plus 平台获取 30.46 Gb 短读长数据(84.14× 覆盖),PacBio Sequel II 平台生成 32.70 Gb HiFi 长读长数据(90.33× 覆盖),结合 61.27 Gb Hi-C 数据(169.25× 覆盖)用于染色体锚定,另通过 RNA-seq 获取 25.21 Gb 转录组数据辅助基因注释。
- 组装与注释:基于 hifiasm 软件组装得到 409.26 Mb 初步基因组,经 purge_dups 去冗余及 NextPolish2 抛光后,利用 Hi-C 数据通过 YaHS 工具将 contigs 锚定至 13 条假染色体,最终获得 362.73 Mb 的无间隙基因组,contig N50 达 25.76 Mb,BUSCO 完整性评估为 98.10%。基因注释通过 MAKER 管道整合同源预测、转录组映射及从头预测,共识别 28,840 个蛋白编码基因,其中 96.22% 获得功能注释。
研究结果
1. 基因组特征与质量评估
通过 17-kmer 分析预测基因组大小为 419.6 Mb,杂合度 1.57%,重复序列占比 52.4%。Hi-C 互作热图显示染色体间信号清晰,LTR 组装指数(LAI)为 21.14,Illumina/HiFi 读段映射率分别为 98.05% 和 99.86%,质量值(QV)73.33,表明组装具有高连续性与准确性。
2. 转座子与非编码 RNA 分析
转座子(TEs)占基因组 36.73%,其中长末端重复序列(LTR)占 24.20%,Gypsy 超家族(19.52%)和 Copia 超家族(4.36%)为主要成分。非编码 RNA 注释包括 526 个 tRNA、125 个 miRNA、3,514 个 rRNA 和 523 个 snRNA,为基因表达调控研究提供资源。
3. 基因功能注释与共线性分析
功能注释显示,26,892 个基因(96.22%)匹配至 NCBI nr、Swiss-Prot 等数据库。与其他 4 种榕属植物的共线性分析表明,琴叶榕基因组结构高度保守,1:1 共线性模块为主,提示其在进化中的稳定性。
4. 基因组进化与转座子动态
LTR 插入时间分析显示,约 0.15 百万年前存在转座子爆发事件,可能与基因组扩张及环境适应相关。
研究结论与意义
本研究首次提供琴叶榕染色体级基因组,揭示其基因组结构特征及进化历史。高质量组装数据为解析榕属植物与传粉蜂协同进化、气生根发育、寿命调控等生物学问题奠定基础,尤其为观赏性状(如叶形变异、抗逆性)的分子机制研究提供关键靶点。结合现有 8 种榕属基因组,该资源将推动热带生态系统物种互作网络、植物适应性进化等领域的深入研究,助力园艺品种分子育种及生态保护策略的开发。研究中建立的多组学整合方法,也为其他高杂合度植物基因组研究提供了技术参考。