曼哈顿多年生黑麦草单倍型基因组组装及干旱响应晚期胚胎发生丰富(LEA)基因家族特征解析

《BMC Genomics》:Haplotype-resolved genome assembly of ‘Manhattan’ perennial ryegrass (Lolium perenne L.) and characterization of drought responsive late embryogenesis abundant genes

【字体: 时间:2025年11月21日 来源:BMC Genomics 3.7

编辑推荐:

  本研究针对草坪型多年生黑麦草(Lolium perenne L.)缺乏高质量基因组资源和干旱响应基因研究不足的问题,通过PacBio HiFi和Hi-C技术完成了栽培品种'Manhattan'的单倍型解析基因组组装(2.3 Gb/单倍型),鉴定出72个LEA基因并发现其中39个在干旱胁迫下显著上调。该研究为禾本科植物抗旱机制研究和草坪草遗传改良提供了重要基因组资源。

  
在凉爽季节的草坪管理领域,多年生黑麦草(Lolium perenne L.)凭借其柔软的叶片和深绿的色泽被誉为"草坪之王"。然而,这种优质草坪草却有一个致命弱点——对干旱胁迫极其敏感。随着全球气候变化导致干旱频发,如何提高黑麦草的抗旱性已成为草坪育种领域的迫切需求。
传统上,大多数关于黑麦草干旱响应的研究都集中在野生种质或饲用型品种上,而对草坪型种质的研究相对匮乏。更为关键的是,科学家们虽然知道一类称为晚期胚胎发生丰富(Late Embryogenesis Abundant, LEA)的蛋白质在植物抗旱中发挥着重要作用,但由于缺乏高质量的草坪型黑麦草基因组参考序列,这些基因的系统性研究和利用一直受到限制。
LEA蛋白最初于1981年在棉花成熟胚胎的脱水阶段被发现,它们通常被称为固有无序蛋白(Intrinsically Disordered Proteins, IDPs),在缺水条件下能够通过稳定蛋白质和膜结构、发挥分子伴侣功能来保护细胞。尽管LEA基因在拟南芥、玉米等模式植物中已有较多研究,但在多年生禾本科草类中的特征描述仍然不足。
为了解决这一知识空白,美国农业部农业研究局(USDA-ARS)的研究团队选择了一个具有历史意义的草坪型黑麦草品种'Manhattan'作为研究对象。这个古老品种是美国许多现代草坪品种和育种系的祖先,对其进行基因组研究不仅有助于理解草坪型黑麦草的遗传特性,还能为抗旱育种提供重要资源。
研究人员采用PacBio HiFi长读长测序和Dovetail Omni-C染色体构象捕获技术,成功构建了'Manhattan'的单倍型解析基因组组装。每个单倍型约为2.3 Gb,包含7条染色体,重复序列含量高达83%,其中长末端重复序列(Long Terminal Repeat, LTR)占主导地位。特别值得注意的是,Gypsy-like反转录转座子在所有染色体的推定着丝粒区域富集,这与禾本科植物的典型基因组特征一致。
通过整合Iso-Seq全长转录本测序、干旱胁迫RNA-seq数据以及同源预测方法,研究团队注释了每个单倍型中约43,000个基因,其中超过95%的基因为完整基因,89%为单拷贝基因,86%具有功能注释。这一高质量的基因组注释为后续基因家族分析奠定了坚实基础。
在关键技术方法方面,研究团队首先通过流式细胞术估计基因组大小,利用PacBio HiFi长读长测序(37×覆盖度)和Omni-C测序数据进行单倍型解析组装,使用BUSCO(Benchmarking Universal Single-Copy Orthologs)和LAI(LTR Assembly Index)评估组装质量。基因注释整合了Iso-Seq、RNA-seq、同源预测和ab initio方法,通过Mikado管道整合不同证据来源的基因模型。LEA基因鉴定采用BLASTP、TBLASTN和HMMER搜索相结合的策略,利用CLANS进行蛋白聚类分析。干旱胁迫实验在生长室条件下对四个基因型进行三周处理,通过RNA-seq和DESeq2分析差异表达基因,使用GSEA(Gene Set Enrichment Analysis)进行基因集富集分析。
LEA基因家族特征
研究人员在单倍型1中鉴定出72个LEA基因,分布在8个Pfam家族中。数量最多的家族是LEA_4(26个),其次是脱水素(Dehydrin, DHN)(14个)和LEA_1(12个)。氨基酸组成分析显示,不同LEA家族在疏水氨基酸、甘氨酸和丙氨酸含量上存在显著差异:LEA_3和种子成熟蛋白(Seed Maturation Protein, SMP)家族的疏水氨基酸含量最高,而DHN和LEA_5家族的甘氨酸含量最高。启动子分析发现,除LEA_3和LEA_5家族外,其他LEA家族基因的启动子区域(起始密码子上游2000 bp)均含有三个或更多的ABA响应元件(ABRE)。
干旱响应表达模式
干旱处理显著降低了所有四个测试基因型的草坪活力评分,并在除2142外的所有基因型中降低了叶片含水量。转录组分析发现,在15,328个有表达证据的基因中,2,495个为差异表达基因(Differentially Expressed Genes, DEGs),其中1,029个上调,1,466个下调。在46个有表达证据的LEA基因中,39个(85%)在干旱胁迫下上调,仅有一个LEA_3基因下调。基因集富集分析显示,四个最大的LEA基因家族(LEA_1、DHN、LEA_4和SMP)在干旱响应中显著富集。
LEA_1家族特征
12个LEA_1基因全部在营养组织中有表达,其中11个是干旱诱导的DEGs。这些基因具有典型的LEA_1 motifs特征:全部携带motif 2,8个携带motif 1,7个携带motif 3。系统发育分析将LEA_1基因分为两个亚群,分别包含4个和8个基因。多个LEA_1基因在2号、5号和7号染色体上形成基因簇,其中一些基因在干旱胁迫下表达量增加超过100倍。
脱水素(DHN)家族分析
14个DHN基因的长度在87-429个氨基酸之间,以高甘氨酸含量和低丙氨酸含量为特征。这些基因携带典型的DHN motifs组合:12个基因至少含有一个K片段,11个含有S片段,8个含有Y片段。表达分析显示,8个DHN基因有表达证据,其中6个是干旱诱导的DEGs。值得注意的是,两个具有YnSKn motifs的DHN基因(Lpman.Chr6G16102和Lpman.Chr4G23266)在对照条件下表达量极低,但在干旱胁迫下表达量增加超过50倍。
基因组比较与进化分析
两个单倍型之间共鉴定出185个倒位、21,011个易位、3,042,731个单核苷酸多态性(Single Nucleotide Polymorphism, SNP)和301,305个插入缺失(Indel)。与先前发表的饲用型黑麦草基因组(Kyuss v2和P226)比较显示广泛的共线性,但与Kyuss v2的共线性更高。所有三个组装中都存在相似的染色体间重复共线性基因块,表明黑麦草基因组中存在古老的基因组复制事件。
研究结论强调,这是首个草坪型多年生黑麦草的单倍型解析基因组组装,为比较基因组学和泛基因组研究提供了宝贵资源。LEA基因的特征描述揭示了它们在黑麦草干旱响应中的重要作用,特别是那些在营养组织中低基础表达但受干旱强烈诱导的基因,如某些LEA_1和DHN基因,它们是未来抗旱遗传改良的优选候选基因。
这项研究的创新之处在于将高质量基因组资源与胁迫生物学研究相结合,不仅提供了草坪型黑麦草的首个单倍型解析基因组,还系统鉴定了干旱响应基因家族,为理解禾本科植物抗旱机制和分子育种提供了新见解。随着干旱胁迫成为美国西部草坪管理的主要挑战,这些LEA基因为未来抗旱品种选育提供了明确的靶标。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号