花生多组学图谱:整合多组学资源平台助力花生研究与分子育种
《Plant Communications》:PeanutOmics: A comprehensive platform with integrative multi-omics atlas for peanut research
【字体:
大
中
小
】
时间:2025年11月23日
来源:Plant Communications 11.6
编辑推荐:
本研究针对花生缺乏综合性多组学资源的问题,构建了覆盖22个关键组织的转录组、蛋白质组和代谢组图谱,鉴定出大量新蛋白和微蛋白,揭示了组织特异性表达模式及关键调控网络,并开发了用户友好的在线平台PeanutOmics,为花生功能基因组学和分子育种提供了宝贵资源。
花生(Arachis hypogaea L.)是全球重要的油料和蛋白来源作物,在经济和生活中占有举足轻重的地位。随着高通量测序技术的飞速发展,整合基因组学、转录组学、蛋白质组学和代谢组学的多组学分析策略,已成为解析植物生长发育、产量形成及抗逆性等复杂性状遗传基础的有力工具。尽管花生已有多个高质量基因组序列发布,例如Tiffrunner、Shitouqi等,并且转录组研究也揭示了组织特异性表达和可变剪接的复杂性,但与其他主要作物(如番茄、水稻)相比,花生仍然缺乏大规模、覆盖全生育期多种组织的综合性多组学数据库。这种资源的匮乏严重限制了对花生生物学过程的深入理解,并阻碍了分子育种效率的提升。为了解决这一瓶颈问题,由河南农业大学尹冬梅教授和上海交通大学魏曹群教授领导的研究团队,在《Plant Communications》上发表了题为“PeanutOmics: A comprehensive platform with integrative multi-omics atlas for peanut research”的研究论文,成功构建了花生首个大规模、多组学整合图谱,并建立了相应的在线平台。
本研究主要运用了以下关键技术方法:以花生品种“农大花108”(NDH108)为材料,采集其22个主要营养和生殖组织(包括根、茎、叶、花器官、果针、不同发育时期的种子和果壳等),每个样本设置三个生物学重复。分别进行转录组(RNA-Seq)、蛋白质组(基于液相色谱-串联质谱LC-MS/MS的DIA采集模式)和代谢组(UPLC-ESI-MS/MS)测序分析。利用生物信息学工具进行基因表达定量、共表达网络(WGCNA)构建、差异表达分析、功能富集分析以及蛋白质组支持的新基因鉴定(proteogenomics)。通过农杆菌(Agrobacterium)介导的遗传转化、qRT-PCR、台盼蓝(TB)和二氨基联苯胺(DAB)染色等技术对候选基因DEF3进行了抗病功能验证。
研究人员对22种花生组织进行了全面的多组学分析。聚类分析显示,生物学功能相关的组织在不同组学层次上呈现出一致的聚类模式。在设定表达阈值(FPKM > 1 或蛋白质相对丰度 > 1)后,在转录水平检测到53,030个基因(占预测编码基因的67.9%),在蛋白质水平检测到12,826个独特基因(对应22,403个基因,占28.7%)。组织间比较发现,雄蕊和60天子叶等组织在较低阈值下基因表达数量与其他组织相当,但在严格阈值下表达基因显著减少,表明这些组织中低丰度转录本和蛋白质占比较高。转录本与蛋白质表达相关性分析显示,平均皮尔逊(Pearson)和斯皮尔曼(Spearman)相关系数分别为0.47和0.44,呈中等程度相关。通过比较营养组织和生殖组织特异性表达的基因,研究人员发现生殖组织转录组特异性基因富集于戊糖和葡萄糖醛酸相互转化、ABC转运蛋白等通路,而营养组织蛋白质组特异性基因则与RNA聚合酶活性相关。
在前期基因组注释的基础上,本研究通过蛋白质基因组学方法,鉴定出2,185个由2,147个基因编码的新蛋白质,这些是此前注释未包含的。这些新编码事件被分为不同类别,其中j、k和m类最为丰富。功能分析表明,j类基因富集于鞘脂代谢、O-葡聚糖生物合成等通路;k类基因参与蛋白质输出、染色质重塑;m类基因则与硫胺素代谢、核糖体生物合成相关。研究还列举了具体案例:例如,j类基因WDR13(WD重复蛋白13)在第三号外显子处发生可变剪接,产生一个缩短的编码区;k类基因TANGO(运输和高尔基体组织蛋白)则表现出3‘ UTR(非翻译区)延伸,并在接种青枯病菌后24小时表达量显著上升,提示其可能参与细菌病害抗性。此外,还鉴定出121个u类(基因间区)蛋白质,其中一个在雄蕊和花瓣中特异性表达的疾病抗性RPP13样蛋白基因尤为引人注目。
微蛋白(microproteins)通常由少于100个氨基酸(AA)的小开放阅读框(sORFs/smORFs)编码,在细胞生理、代谢和信号传导中起重要作用。本研究通过蛋白质组学方法,在22种花生组织中鉴定出274个微蛋白基因(269个为已知,5个为新发现)。这些微蛋白的长度在66至100个氨基酸之间,在营养和生殖组织中均有表达。功能域(Pfam)富集分析显示,两类组织共有的微蛋白富集于Tim10/DDP家族锌指结构等域,而生殖组织特异性微蛋白则富集于SLR1-BP(S位点相关糖蛋白1结合蛋白)、植物自交不亲和性蛋白S1、晚期胚胎发生丰富蛋白(LEA)等域,反映了其在生殖发育中更广泛的功能多样性。研究重点介绍了两例相邻的微蛋白基因DEF3和DEF1(防御素3和1),它们分别编码花生过敏原Arah 13和Arah 12。同线性(collinearity)分析显示DEF3仅存在于08号染色体上,而其同源染色体18上则缺失。序列和结构比对显示二者具有56.6%的序列同一性和中等程度的结构相似性。表达分析表明,二者在子叶中的蛋白质表达量均高于其他组织。值得注意的是,在青枯病菌感染后,DEF3的表达显著上调,而DEF1无显著变化。通过花生根毛和叶片的遗传转化实验,证实过表达DEF3能显著增强花生对青枯病的抗性,表现为植株萎蔫减轻、根部细菌定殖量降低以及叶片细胞死亡和病斑形成减少。
利用加权基因共表达网络分析(WGCNA),研究人员将基因划分为24个共表达模块(ME)。多个模块表现出显著的组织特异性表达,例如ME_magenta(雄蕊)、ME_darkgreen(子叶)、ME_tan(胚)、ME_darkturquoise(果针)和ME_purple(不同发育阶段种子)。功能富集分析揭示,ME_lightcyan(茎)模块基因与异黄酮生物合成、甘油磷脂代谢相关;ME_cyan(根)模块基因富集于黄酮生物合成、氰基氨基酸代谢;ME_darkturquoise(果针)模块基因与植物激素信号转导、苯丙烷类生物合成密切相关;而ME_purple(种子)模块则主导脂肪酸生物合成与代谢、黄酮生物合成以及糖酵解/糖异生途径。对种子发育过程中差异表达基因(DEG)的分析表明,在45天时上调的基因在转录和蛋白质水平均富集于脂肪酸代谢、TCA循环(三羧酸循环)等通路。研究还特别指出,参与脂肪酸代谢的基因ADRC1(NADPH依赖性醛还原酶1)及其同源基因NDH16G09780在60天子叶和胚中表达存在差异,ADRC1在转录和蛋白质水平均高表达,而其同源基因仅在转录水平高表达,揭示了异源四倍体花生亚基因组间基因表达的不平衡现象。
代谢组学分析共鉴定出2,035种相对丰度>1的代谢物。果针是花生特有的、负责将子房推入土壤中发育成果实的器官。研究发现果针组织中脂质、生物碱、氨基酸及其衍生物、木脂素和香豆素以及萜类代谢物显著上调。其中,异芒果甾酸(isomangiferolic acid)与两个激素信号相关基因IAA30和ARF2B呈强正相关。共表达网络分析进一步揭示了果针发育中一个以生长素(IAA)和生长素响应因子(ARF)家族基因为核心的调控网络,包括ARF2、ARF4、ARF17等关键组分,它们共同调控细胞膨大和生长过程。
为了促进数据的广泛利用,研究团队开发了在线平台PeanutOmics(https://cgm.sjtu.edu.cn/PeanutOmics)。该平台整合了基因组、转录组、蛋白质组和代谢组数据,提供基于JBrowse2的基因组浏览器进行可视化、BLAT比对工具以及蛋白质-蛋白质相互作用(PPI)网络查询等功能,为研究人员进行基因功能挖掘、代谢通路分析和分子育种设计提供了便捷的一站式资源。
本研究构建了花生迄今最全面的多组学图谱,通过整合转录组和蛋白质组学证据,显著丰富了花生蛋白质数据库,发现了大量新蛋白和具有重要功能的微蛋白(如DEF3),揭示了组织特异性表达模块和关键代谢通路(如果针中的IAA-ARF信号网络),并建立了开放的资源共享平台。这些成果为花生功能基因组研究、重要农艺性状基因的克隆以及分子设计育种奠定了坚实的基础。尽管取得了重要进展,作者也指出了一些局限性,例如蛋白质证据覆盖的基因比例仍有待提高,部分发现属于相关性结论需进一步功能验证等。未来研究可侧重于利用单细胞测序、CRISPR基因编辑等技术深入解析关键基因功能,并整合不同品种的基因组和表观基因组数据,以全面揭示花生的遗传调控网络。总之,这项研究为应对粮食安全和气候变化挑战下的花生遗传改良提供了强大的数据支撑和工具平台,标志着花生研究进入了一个新的多组学时代。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号