
-
生物通官微
陪你抓住生命科技
跳动的脉搏
TeloComp:高效精准的端粒组装工具助力T2T基因组研究新突破
【字体: 大 中 小 】 时间:2025年08月26日 来源:Plant Communications 11.6
编辑推荐:
为解决T2T(端粒到端粒)基因组组装中端粒序列缺失的技术难题,研究人员开发了高效工具TeloComp。该工具通过整合三代测序数据(HiFi/ONT)和物种特异性端粒重复基序,实现了端粒区域的精准识别与补全,显著提升了基因组完整性。研究在桑树(Morus notabilis)等12种植物中验证了其普适性,为基因组进化与功能研究提供了新方法。
研究背景
基因组组装的完整性和准确性是功能与进化研究的基石。随着三代测序技术的发展,端粒到端粒(T2T)基因组组装成为可能。然而,位于染色体末端的端粒(telomere)由高度重复的核苷酸序列(如植物中常见的TTTAGGG/CCCTAAA)构成,在传统组装中极易丢失。这种缺失不仅影响基因组完整性,更阻碍了端粒在基因组稳定性、细胞衰老等关键生物学过程中的机制研究。现有工具(如TelomereHunter)仅能识别已知端粒,无法基于测序数据补全缺失区域,成为T2T基因组研究的瓶颈。
技术方法
研究团队开发了TeloComp工具包,包含四个模块:1)基于比对和覆盖度筛选染色体末端延伸读长;2)利用Flye重叠图谱法组装端粒草案;3)通过全基因组测序(WGS)抛光序列;4)可视化端粒长度与重复基序分布。测试使用桑树等12个物种的HiFi/ONT数据,涵盖藻类、被子植物、多倍体等不同复杂度基因组。
研究结果
端粒补全验证
在桑树T2T基因组中,TeloComp成功补全了chr2右端24 kb的端粒区域,ONT读长支持度验证了其可靠性。序列分析显示该区域富含TTTAGGG重复单元,与物种已知端粒特征一致。
跨物种适用性
单子叶植物:水稻(Oryza sativa)多个染色体端粒延伸超1 kb
多倍体:四倍体烟草(Nicotiana benthamiana)端粒数量显著增加
大基因组:莱茵衣藻(Chlamydomonas reinhardtii)染色体15端粒延伸9 kb
裸子植物:南方红豆杉(Taxus chinensis)基于CCCTAAA基序成功补全端粒
性能评估
TeloComp在10-20小时内完成不同基因组处理,内存消耗与数据量正相关。端粒重复基序统计显示,补全后序列的基序富集度显著提升,其中桑树和木薯(Manihot esculenta)补全效果最优。
结论与意义
TeloComp是首个专注于端粒补全的基因组工具,其创新性体现在:1)基于测序数据的动态补全策略,突破现有工具仅能识别的局限;2)模块化设计适配不同组装需求;3)跨物种验证证实其对复杂基因组的处理能力。该研究发表于《Plant Communications》,为端粒演化、染色体保护机制等研究提供了关键技术支撑,未来可与荧光原位杂交(FISH)等实验技术联动,推动T2T基因组研究的标准化进程。
生物通微信公众号
知名企业招聘