编辑推荐:
为探究海棠花色及其他观赏性状的遗传基础,北京植物园等研究人员对红肉苹果(Malus niedzwetzkyana,MN)进行基因组测序分析。他们获得高质量染色体级基因组,注释大量基因。该研究为海棠遗传育种提供关键依据,推动相关领域发展。
在繁花似锦的植物王国中,海棠以其缤纷多彩的花朵备受瞩目。然而,长期以来,海棠花的颜色大多局限于白色和粉色,这让园艺爱好者们多少有些遗憾。直到红肉苹果(
Malus niedzwetzkyana,MN)的出现,情况才有所改观。它作为玫瑰海棠杂交品种的母本,其后代花朵呈现出浓郁的红色和紫色,大大提升了海棠的观赏价值。但这些美丽花色背后的遗传奥秘却一直未被揭开,这也成为园艺学和植物遗传学领域亟待解决的问题。为了探寻海棠花色及其他观赏性状的遗传基础,推动植物遗传学和育种领域的发展,北京植物园、北京林业和草原局植物迁地保护重点实验室以及北京花卉工程技术研究中心的研究人员开展了深入研究。相关成果发表在《
Scientific Data》杂志上。
研究人员运用多种前沿技术开展此项研究。首先是基因组测序技术,利用 Illumina 短读长测序、PacBio 高保真(HiFi)长读长测序以及高通量染色体构象捕获(Hi-C)测序技术获取数据。然后借助生物信息学分析方法,像使用 hifiasm 软件进行基因组组装,运用 BUSCO 评估基因组完整性,采用多种工具预测基因和注释功能等,对获得的数据进行深度剖析。
在基因组组装成果方面,研究人员成功获得了 MN 高质量的染色体级基因组。通过 17 - mer 分析,估计其基因组大小约为 678.26 Mb,最终组装的基因组大小为 672.64 Mb,contig N50 达到 36.45 Mb 。借助 Hi - C 数据,将组装的 contigs 锚定到 17 条假染色体上,锚定率高达 98.38%。并且在 12 条染色体两端都鉴定出了两个端粒,4 条染色体一端鉴定出一个端粒,仅 15 号染色体未鉴定出端粒,这表明组装的基因组接近端粒到端粒(T2T)且几乎无间隙。此外,该基因组的 BUSCO 完整性评分为 98.6%,长末端重复(LTR)组装指数(LAI)为 21.99,达到 “黄金标准” 水平,说明基因组组装质量极高。
重复序列与基因注释方面,研究发现 MN 基因组中重复序列占比达 70.90%,其中 LTR 反转录转座子最为丰富,占基因组的 52.82%。研究人员采用从头预测、同源性预测和转录组预测等策略,在 MN 基因组中总共注释出 43,813 个蛋白质编码基因 。这些预测蛋白质的 BUSCO 评分为 98.30%,且 98.08% 的蛋白质编码基因在多个数据库中成功注释。同时,还鉴定出 4,351 个非编码 RNA 基因,包括 152 个微小 RNA(miRNA)、770 个转移 RNA(tRNA)、3,074 个核糖体 RNA(rRNA)和 355 个小核 RNA(snRNA)。
研究结论表明,研究人员成功构建了 MN 高质量的染色体级基因组,这一成果为深入研究海棠花色及其他观赏性状的遗传机制提供了坚实基础。通过对基因组的分析,挖掘出大量与花色等性状相关的基因,有望为后续海棠新品种的培育提供理论指导,助力园艺育种工作。
此次研究意义重大,它填补了 MN 基因组研究的空白,让人们对海棠属植物的遗传信息有了更深入的理解。其成果为植物遗传学和育种领域提供了关键数据,有助于培育出更多花色丰富、观赏价值高的海棠品种,满足人们对美好植物景观的需求,也为其他植物的基因组研究和遗传改良提供了参考范例,推动整个植物科学领域不断向前发展。