PhaseGrass:攻克高杂合度禾草基因组单倍型解析组装难题的新利器

《Nature Communications》:Chromosome-level haplotype-resolved assembly of highly heterozygous grass genomes with PhaseGrass

【字体: 时间:2025年12月21日 来源:Nature Communications 15.7

编辑推荐:

  针对高杂合度基因组组装中参考序列偏好性及单倍型划分不均的技术瓶颈,研究人员开发了PhaseGrass工作流程。该研究通过结合参考序列引导分型与单倍型特异性k-mer策略,成功实现了黑麦草属物种染色体级别的单倍型解析组装,为高杂合度植物泛基因组研究提供了重要技术支撑。

  
在植物基因组学研究领域,高度杂合基因组的精准解析一直是个棘手难题。像黑麦草这样的异花授粉禾本科植物,其基因组中存在着大量等位基因变异和结构变异,给传统组装方法带来巨大挑战。现有技术如参考序列引导分相存在参考偏好性问题,而图结构分相方法又容易导致单倍型划分不平衡——这些局限严重制约着高质量泛基因组研究的深入开展。
正是在这一技术背景下,苏黎世联邦理工学院等机构的研究团队在《Nature Communications》上发表了题为"Chromosome-level haplotype-resolved assembly of highly heterozygous grass genomes with PhaseGrass"的重要研究成果。他们开发出的PhaseGrass工作流程,创新性地将参考序列引导分相与单倍型特异性k-mer分析相结合,成功实现了对高杂合度禾草基因组的精准解析。
研究团队采用的技术方法主要包括:利用PacBio高精度长读长或常规长读长测序数据,通过参考序列引导分相初步划分单倍型,再基于单倍型特异性k-mer进行精细校正,最后借助染色体构象捕获技术进行支架构建,从而获得染色体级别的单倍型解析组装结果。
PhaseGrass工作流程的设计与优化
研究团队开发的PhaseGrass流程包含三个核心模块:组装、分相和支架构建。该系统首先对长读长序列进行初步组装,随后通过参考序列引导的分相方法识别杂合位点,再利用单倍型特异性k-mer对初步分相结果进行验证和优化,确保每个单倍型都能获得均衡的序列覆盖度。与WhatsHap相比,PhaseGrass能将20%更多的读长准确划分到对应单倍型。
多年生黑麦草与多花黑麦草的基因组组装
应用PhaseGrass,研究人员成功构建了多年生黑麦草(Lolium perenne)和多花黑麦草(Lolium multiflorum)的染色体级别单倍型解析组装。这两个物种均为高杂合度的异花授粉禾本科植物,其基因组中存在着丰富的等位基因变异。PhaseGrass生成的组装结果显示出优异的连续性、完整性和单倍型平衡性,为后续比较基因组分析奠定了坚实基础。
与Hifiasm等方法的性能比较
与当前主流组装工具Hifiasm相比,PhaseGrass在处理高杂合度基因组时表现出显著优势。特别是在多花黑麦草的组装中,Hifiasm由于单倍型间丰富的结构变异而产生了严重不平衡的单倍型划分结果,而PhaseGrass则成功生成了平衡且完整的单倍型解析组装,证明了其在处理复杂基因组结构变异方面的鲁棒性。
结构变异与单倍型不平衡的关联分析
进一步分析表明,单倍型间存在的结构变异是导致传统分相方法产生不平衡组装的主要原因。PhaseGrass通过整合多种分相信号,有效克服了结构变异对单倍型划分的干扰,确保了每个单倍型都能获得充分且准确的序列覆盖,为研究基因组结构变异的生物学意义提供了可靠工具。
研究结论表明,PhaseGrass作为一种高效、准确的单倍型解析组装流程,成功解决了高杂合度基因组组装中的关键技术难题。它不仅避免了参考序列偏好性问题,还确保了单倍型划分的平衡性,为高度杂合植物物种的泛基因组研究提供了强大技术支持。该研究的成功实施标志着植物基因组学研究向着更精准、更全面的方向迈出了重要一步,未来有望广泛应用于各类复杂基因组的解析工作中,推动作物育种和进化生物学研究的深入发展。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号