TeloComp:高效精准的端粒组装工具助力T2T基因组研究新突破

【字体: 时间:2025年08月26日 来源:Plant Communications 11.6

编辑推荐:

  为解决T2T(端粒到端粒)基因组组装中端粒序列缺失的技术难题,研究人员开发了高效工具TeloComp。该工具通过整合三代测序数据(HiFi/ONT)和物种特异性端粒重复基序,实现了端粒区域的精准识别与补全,显著提升了基因组完整性。研究在桑树(Morus notabilis)等12种植物中验证了其普适性,为基因组进化与功能研究提供了新方法。

  

研究背景

基因组组装的完整性和准确性是功能与进化研究的基石。随着三代测序技术的发展,端粒到端粒(T2T)基因组组装成为可能。然而,位于染色体末端的端粒(telomere)由高度重复的核苷酸序列(如植物中常见的TTTAGGG/CCCTAAA)构成,在传统组装中极易丢失。这种缺失不仅影响基因组完整性,更阻碍了端粒在基因组稳定性、细胞衰老等关键生物学过程中的机制研究。现有工具(如TelomereHunter)仅能识别已知端粒,无法基于测序数据补全缺失区域,成为T2T基因组研究的瓶颈。

技术方法

研究团队开发了TeloComp工具包,包含四个模块:1)基于比对和覆盖度筛选染色体末端延伸读长;2)利用Flye重叠图谱法组装端粒草案;3)通过全基因组测序(WGS)抛光序列;4)可视化端粒长度与重复基序分布。测试使用桑树等12个物种的HiFi/ONT数据,涵盖藻类、被子植物、多倍体等不同复杂度基因组。

研究结果

端粒补全验证

在桑树T2T基因组中,TeloComp成功补全了chr2右端24 kb的端粒区域,ONT读长支持度验证了其可靠性。序列分析显示该区域富含TTTAGGG重复单元,与物种已知端粒特征一致。

跨物种适用性

  • 单子叶植物:水稻(Oryza sativa)多个染色体端粒延伸超1 kb

  • 多倍体:四倍体烟草(Nicotiana benthamiana)端粒数量显著增加

  • 大基因组:莱茵衣藻(Chlamydomonas reinhardtii)染色体15端粒延伸9 kb

  • 裸子植物:南方红豆杉(Taxus chinensis)基于CCCTAAA基序成功补全端粒

性能评估

TeloComp在10-20小时内完成不同基因组处理,内存消耗与数据量正相关。端粒重复基序统计显示,补全后序列的基序富集度显著提升,其中桑树和木薯(Manihot esculenta)补全效果最优。

结论与意义

TeloComp是首个专注于端粒补全的基因组工具,其创新性体现在:1)基于测序数据的动态补全策略,突破现有工具仅能识别的局限;2)模块化设计适配不同组装需求;3)跨物种验证证实其对复杂基因组的处理能力。该研究发表于《Plant Communications》,为端粒演化、染色体保护机制等研究提供了关键技术支撑,未来可与荧光原位杂交(FISH)等实验技术联动,推动T2T基因组研究的标准化进程。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号