
-
生物通官微
陪你抓住生命科技
跳动的脉搏
八倍体草莓全基因组单倍型解析揭示着丝粒卫星序列的进化动态
【字体: 大 中 小 】 时间:2025年02月10日 来源:Genome Biology 10.1
编辑推荐:
本期推荐:昆明植物研究所朱安丹团队通过整合PacBio HiFi、Nanopore R10/Ultra-long和Hi-C等多组学数据,开发两步法整合组装策略,首次构建了八倍体草莓Fragaria × ananassa cv."EA78"(2n=8x=56)完全分型的参考基因组,揭示着丝粒卫星(147 bp)在50条染色体上的分布规律及6个新着丝粒(neocentromeres)的形成机制,为多倍体作物着丝粒进化研究提供重要范式。论文发表于《Genome Biology》。
研究团队整合43.8 Gb PacBio HiFi、132.4 Gb Nanopore(含R10和Ultra-long)、105.2 Gb Hi-C及59.9 Gb Illumina数据,开发两步法组装策略:先以HiFi+Hi-C+Ultra-long构建骨架,再基于 trio-binning 信息重分配单倍型序列。最终获得父本(797.4 Mb)和母本(801.4 Mb)两套完全分型的基因组,N90达21-22 Mb,单碱基错误率<0.05%,填补了八倍体草莓高质量参考基因组的空白。
关键发现包括:1)染色体特征:鉴定到112个端粒中的106个(CCCTAAA重复),发现42.7%的转座元件(Copia占5.26%,Gypsy占14.17%);2)着丝粒变异:在50条染色体上发现147 bp典型着丝粒卫星(type I),但1B_mat等6条染色体缺失该序列,FISH和CENH3-ChIP-seq证实其存在新型着丝粒(types II-IV);3)进化动态:野生八倍体(F. chiloensis和F. virginiana)相比二倍体祖先F. vesca着丝粒显著扩张,栽培种中A亚基因组着丝粒长度增加最显著(p<0.05);4)同源分化:着丝粒序列在同源染色体间相似性(ANI>90%)高于同祖染色体,但Chr5B-C等例外,支持F. vesca仅贡献A亚基因组的进化模型。
技术方法亮点:1)多平台测序数据整合(PacBio HiFi+ONT R10/Ultra-long+Hi-C);2)开发两步法分型策略(Hi-C全局分型+trio局部校正);3)草莓特异性CENH3抗体研制(基于8个同源基因设计抗原);4)着丝粒卫星分类系统(基于147 bp单体聚类);5)野生种基因组重组装(提升F. chiloensis等连续性)。
结果部分的核心发现:
◆ 基因组组装评估:HiFi+Hi-C模式分型错误率(0.041-0.052%)与trio-binning相当(0.034-0.037%),但后者在无家系信息时存在单倍型误分风险。
◆ 着丝粒特征:type I卫星与F. vesca同源性达97-99.9%,六条染色体携带新着丝粒(type II:146 bp;type III:158 bp;type IV分IV-1/IV-2亚型),CENH3富集区与卫星定位偏差揭示4C_mat染色体着丝粒重定位。
◆ 进化比较:栽培草莓着丝粒卫星拷贝数显著多于野生种,F. chiloensis的1D染色体双单倍型均携带type II卫星,而F. virginiana保留type I,表明种间分化前已发生着丝粒转换。
讨论指出:这是首个完全分型的八倍体草莓基因组,揭示着丝粒卫星在多倍化过程中的动态演化规律。发现着丝粒大小与卫星拷贝数显著相关(R2=0.94),且扩张现象与驯化选择相关。研究为解析多倍体减数分裂稳定性机制提供了新视角,建立的CENH3-ChIP-seq技术体系可推广至其他多倍体作物研究。
该研究通过创新基因组学方法破解了八倍体基因组的组装难题,建立的"EA78"参考基因组可作为草莓群体遗传学研究的新标准。未来需进一步探索着丝粒扩张对染色体稳定性的影响,以及单平台分型技术的开发。论文数据已存储于国家基因组科学数据中心(PRJCA015503),为后续研究提供重要资源。
生物通微信公众号
知名企业招聘