
-
生物通官微
陪你抓住生命科技
跳动的脉搏
粳稻品种中花11号完整基因组组装揭示高质量T2T基因组图谱
【字体: 大 中 小 】 时间:2025年07月25日 来源:Plant Communications 9.4
编辑推荐:
为解决中花11号(ZH11)基因组组装不完整问题,研究人员利用PacBio HiFi和ONT测序技术完成首个端粒到端粒(T2T)水平的基因组组装(379.33 Mb),填补25个缺口并新增2.29 Mb序列。通过多组学验证和功能注释(预测56,948个基因),该研究为水稻功能基因组研究提供黄金标准参考基因组,显著提升GWAS和单细胞转录组分析的准确性。
水稻作为全球最重要的粮食作物之一,其基因组研究一直是植物科学领域的重点。粳稻品种中花11号(ZH11)因其高转化效率和强适应性,成为实验室研究的模式品种,过去20年相关研究论文达数千篇。然而令人遗憾的是,尽管已有多个水稻品种完成基因组测序,ZH11的参考基因组仍存在25个缺口,这严重限制了其作为研究模型的应用价值。
中国科学院植物研究所植物分子生理学重点实验室的研究人员联合多家机构,采用第三代测序技术攻克了这一难题。他们通过整合PacBio HiFi(高精度长读长)和Oxford Nanopore(超长读长)测序数据,结合Hi-C染色体构象捕获技术,成功构建了首个端粒到端粒(T2T)水平的ZH11基因组,相关成果发表在《Plant Communications》。这项研究不仅填补了现有基因组的所有缺口,还新增了2.29 Mb的未知序列,包括在5号染色体末端发现的新基因Osa05G046820。
研究团队主要运用了四项关键技术:PacBio HiFi测序(60×覆盖度)保证单碱基精度,ONT超长读长(102×)解决复杂重复区域,Hi-C(42.59 Gb)辅助染色体支架构建,以及单细胞RNA测序(scRNA-seq)验证基因组功能注释。特别值得注意的是,他们利用147.56 Gb的根部单细胞转录组数据,证明T2T-ZH11的基因检出率(94.7%)显著优于日本晴参考基因组(T2T-Nip)的81.3%。
基因组质量评估方面,研究结果显示:
• 连续性指标:组装大小379.33 Mb,contig N50达31.07 Mb,12条染色体全部完整
• 完整性验证:BUSCO评估99.01%完整,CEGMA核心基因覆盖99.56%
• 结构特征:精准定位24个端粒和12个着丝粒,其中9号染色体着丝粒位置与T2T-Nip存在显著差异
• 重复序列:45.89%为转座元件(TE),4.77%为串联重复序列
功能注释的突破体现在:
• 基因预测:通过Iso-seq和RNA-seq整合分析,注释基因数从旧版的37,341个提升至56,948个
• 表观遗传:利用公共ATAC-seq和DNA甲基化数据证实新基因组显著提高染色质开放区域检测灵敏度
• 农艺性状关联:基于533个品种的GWAS分析,在T2T-ZH11上精确定位到抽穗期关键基因Hd1和粒重基因GW8
讨论部分强调,这是首个达到"黄金标准"(LAI>20)的ZH11基因组,其LTR组装指数(LAI)达21.61,与T2T-Nip相当。研究不仅解决了长期存在的基因组缺口问题,更通过单细胞转录组证明其作为参考基因组的优越性——相比T2T-Nip,使用T2T-ZH11时单细胞UMI中位数增加6.2%,基因检出总数提升2.5%。这些发现为水稻基因功能研究、分子育种和进化分析提供了不可替代的基因组资源,相关数据已整合至CROPTILLING数据库(http://www.croptilling.com/ZH11)供全球研究者使用。
该研究的创新性在于首次实现ZH11基因组的T2T水平组装,并系统验证了其在多组学分析中的优势。正如通讯作者Chun-Ming Liu指出,这项成果将推动水稻研究从"有缺口的参考时代"迈向"完整基因组时代",为解析复杂农艺性状的遗传基础提供全新工具。
生物通微信公众号
知名企业招聘