
-
生物通官微
陪你抓住生命科技
跳动的脉搏
四倍体马铃薯品种Désirée单倍型解析基因组组装与表观遗传图谱构建
【字体: 大 中 小 】 时间:2025年06月21日 来源:Scientific Data 5.8
编辑推荐:
本研究针对栽培四倍体马铃薯基因组复杂性和现有参考基因组局限性,通过PacBio HiFi和Hi-C技术首次完成重要品种Désirée的单倍型解析染色体级别组装(CRAQ AQI 97.5),结合RNA-seq和纳米孔甲基化测序构建了包含44,156-49,598个基因的注释系统,填补了该模型品种基因组空白,为马铃薯等位基因特异性表达研究和分子育种提供关键资源。
马铃薯作为全球第四大主粮作物,其四倍体基因组的高度杂合性和重复序列特性长期阻碍精准基因组学研究。尽管二倍体马铃薯DM参考基因组已被广泛应用,但栽培品种中大量等位基因变异和表观遗传调控信息缺失,严重制约抗逆育种效率。斯洛文尼亚国家生物学研究所联合德国于利希研究中心等团队在《Scientific Data》发表研究,通过多组学整合策略破解了这一难题。
研究采用PacBio HiFi(79.4 Gbp数据)结合Hi-C(2018.4 million reads)完成四套单倍型组装,利用Merqury评估显示98.57%基因组完整性。纳米孔测序(5.8 Gbp)首次绘制全基因组甲基化图谱,EDTA鉴定70%重复序列。通过BRAKER3整合五种预测方法,最终注释181,929个基因,OMArk显示99.3%保守基因覆盖。
基因组组装与质量评估
Hifiasm生成的初始contig经Hi-C锚定后,scaffold N50达58.0 Mb。如图1b所示,Merqury k-mer谱证实支架化有效解决了序列重复问题。四套单倍型大小介于761.6-888.4 Mb,与DM基因组比对揭示显著结构变异(图1d)。
重复序列与基因注释
LTR反转座子占比最高(23.7-27.3%),其中Gypsy类占比达14.5-18.9%(表2)。通过整合StringTie2和IsoQuant转录本数据,基因模型平均含5.28个外显子,94.1-95.4% BUSCO完整性(图3a)。
功能注释与比较基因组学
EggNOG和Mercator4联合注释显示93.5%蛋白可分类,55.3%直系同源群存在于所有单倍型。与UniTato注释比较发现17.24%基因为Désirée特有。
该研究首次实现不依赖亲本信息的四倍体马铃薯单倍型分型,建立的在线基因组浏览器(https://desiree.nib.si)整合了甲基化与表达数据。值得注意的是,组织培养历史未导致显著TE扩增,但LTR元件分布差异暗示表观调控多样性。作为目前最完整的栽培马铃薯基因组资源,该成果将推动等位基因互作研究和精准育种技术发展,为构建马铃薯泛基因组奠定基础。
生物通微信公众号
知名企业招聘