
-
生物通官微
陪你抓住生命科技
跳动的脉搏
野生桑树蒙古桑(Morus mongolica)端粒到端粒(T2T)基因组组装揭示桑属染色体断裂融合机制
【字体: 大 中 小 】 时间:2025年04月26日 来源:Scientific Data 5.8
编辑推荐:
为解决桑属(Morus)物种复杂染色体进化机制和基因组完整性难题,中国安康学院研究人员通过整合NGS、HiFi、ONT和Hi-C技术,首次完成野生蒙古桑(M. mongolica)高质量T2T基因组组装(341.88 Mb,N50 23.82 Mb),鉴定28个端粒(9.86 kb)和14个着丝粒(1.91 Mb),揭示桑属染色体断裂-融合事件多发生于着丝粒区域,为桑树育种和进化研究提供关键基因组证据。
桑树作为丝绸产业的核心作物,其基因组进化历史却充满谜团。尽管已有多个桑树物种基因组被解析,但染色体数目差异(n=6或14)和多倍化现象背后的机制仍不明确。尤其令人困惑的是,桑属物种在进化过程中频繁发生的染色体断裂与融合事件,是否与特定基因组结构相关?这一问题直接关系到桑树种质资源利用和遗传改良。
中国安康学院陕西省蚕桑重点实验室的研究团队选择野生蒙古桑(Morus mongolica)为研究对象,通过多组学技术首次构建了该物种的端粒到端粒(Telomere-to-Telomere, T2T)完整基因组图谱,相关成果发表于《Scientific Data》。研究采用流式细胞术确认蒙古桑为二倍体(2n=28),整合DNBSEQ-T7RS短读长(18.91 Gb)、PacBio HiFi(31.10 Gb,N50 15.81 kb)、ONT超长读长(59.79 Gb,N50 74.76 kb)和Hi-C(64.55 Gb)数据,结合hifiasm和LACHESIS组装策略,最终获得包含14条染色体的高质量基因组(341.88 Mb),BUSCO评估完整性达99.44%。
基因组特征分析
通过Tidk和quarTeT工具鉴定出28个端粒(平均9.86 kb)和14个着丝粒(平均1.91 Mb),后者占基因组7.84%。重复序列占比54.55%,其中LTR(34.34%)和DNA转座子(11.36%)为主。基因预测显示21,657个蛋白编码基因,平均CDS长度(1,316.25 bp)为已发表桑树基因组中最长。
比较基因组学发现
与栽培种白桑(M. alba, n=14)和野生种川桑(M. notabilis, n=6)的共线性分析揭示:川桑的1-4号染色体在蒙古桑中对应多个染色体(如川桑chr1对应蒙古桑chr4/7/9/11),且8个断裂位点均位于川桑着丝粒区域。这一发现首次从基因组层面证实桑属染色体断裂-融合事件倾向于发生在着丝粒重复序列富集区。
该研究不仅填补了n=14型桑树T2T基因组的空白,更通过高精度基因组比较揭示了桑属染色体演化的"热点区域"。着丝粒作为基因组不稳定的敏感区域,其重复序列特性可能为染色体断裂提供力学基础,这一发现为解释桑属多倍化现象和种间染色体数变异提供了分子机制模型。此外,蒙古桑基因组中LTR逆转录转座子的显著扩张(34.34%),暗示转座子活动可能在桑属适应性进化中扮演关键角色。
研究团队公开了所有原始数据(NCBI SRA: SRR31045530等)和组装结果(GenBank: JBIQNV000000000),为后续桑树功能基因组研究和分子设计育种奠定基础。该成果对理解蔷薇目植物染色体演化规律具有范式意义,也为经济作物基因组组装提供了技术参考。
生物通微信公众号
知名企业招聘