CGRP:解码葫芦目全基因组复制事件,构建多组学整合研究新范式

《Plant Communications》:CGRP: A versatile platform for exploring the genomics of Cucurbitales

【字体: 时间:2025年12月29日 来源:Plant Communications 11.6

编辑推荐:

  为解决葫芦目(Cucurbitales)物种因古多倍化(WGD)导致的基因组结构复杂、进化轨迹难以追溯及关键性状基因挖掘困难等问题,研究人员构建了葫芦目基因组研究平台(CGRP)。该平台整合了213个基因组、7,109个转录组及大规模代谢组数据,通过共线性分析、祖先基因组重建及基因家族进化分析,系统解析了葫芦目物种的基因组进化与功能创新,为葫芦目作物的分子育种提供了强大的数据支撑与工具支持。

  
在浩瀚的植物王国中,葫芦目(Cucurbitales)是一个极具经济与生态价值的类群。它不仅包含了我们餐桌上的常客——西瓜、甜瓜、黄瓜、南瓜等,还拥有众多药用与观赏植物。然而,这个类群的基因组却异常复杂,其背后隐藏着多次全基因组复制(Whole-Genome Duplication, WGD)事件。这些古老的“基因复制风暴”虽然为物种带来了丰富的遗传创新潜力,但也导致了基因组结构的剧烈重组与基因家族的急剧扩张,使得科学家们难以追溯其进化轨迹,也难以精准挖掘控制重要农艺性状的关键基因。
为了攻克这一难题,由华北理工大学王金鹏教授领衔的研究团队,构建了一个名为葫芦目基因组研究平台(Cucurbitales Genome Research Platform, CGRP)的综合性研究工具。该平台整合了海量的多组学数据与强大的分析工具,旨在系统解析葫芦目物种的基因组进化与功能创新,为相关作物的分子育种提供强有力的数据支撑。相关研究成果已发表于国际知名期刊《Plant Communications》。
关键技术与方法
研究团队首先整合了葫芦目内已发表的34个物种的基因组数据,并新测序组装了葫芦科早期分化物种雪胆(Hemsleya chinensis)的基因组,构建了包含213个基因组的统一资源库。在此基础上,他们利用标准化的生物信息学流程,对29个核心物种的基因组进行了系统注释,包括基因功能、转座子(Transposable Elements, TEs)、调控蛋白(Regulatory Proteins, RPs)及N6-甲基腺苷(N6-methyladenosine, m6A)修饰调控因子等。核心分析包括:通过900对基因组比较构建了大规模共线性(Synteny)图谱;利用多基因组比对重建了葫芦目祖先基因组;基于共线性关系鉴定了32,672个直系同源群(Synteny-based Orthogroups, Syn-OGs);并整合了7,109个转录组及大规模代谢组数据,以支持功能基因组学研究。
研究结果
1. 构建了葫芦目最全面的基因组资源库
CGRP整合了葫芦目内最广泛的基因组资源,包含213个统一格式的基因组,涵盖了34个物种。其中,新测序组装的雪胆基因组为研究葫芦科的早期进化提供了关键材料。平台集成了JBrowse基因组浏览器,并开发了便捷的基因获取工具,使用户能够轻松浏览基因组细节并获取特定染色体区域的基因信息。
2. 系统解析了全基因组复制(WGD)驱动的基因组进化
研究团队通过900对基因组比较,鉴定了12,083,671个基因对,构建了1,208,371个共线性区块(Syntenic Blocks, SBs)。基于此,他们开发了Syn-Blocks和Syn-Dotplots界面,分别用于推断WGD和物种形成相关的共线性区块,以及可视化展示WGD事件、染色体重排(Chromosome Rearrangements, CRs)和基因组片段化(Genomic Fractionation)过程。这些工具为揭示葫芦目复杂的基因组进化历史提供了直观的证据。
3. 重建了葫芦目祖先基因组并揭示其进化轨迹
研究团队构建了一个包含7个WGD事件的多基因组比对矩阵,涉及22,523,647个基因。利用这一矩阵,他们重建了葫芦目的祖先基因组,并开发了Anc-Genomes和Anc-Aligning界面。这些工具不仅能够静态和动态地展示祖先基因组,还能将新测序的基因组与祖先基因组进行比对,从而揭示其进化轨迹,为理解物种分化过程中的基因组重塑提供了新视角。
4. 挖掘了与重要农艺性状相关的基因家族
平台提供了基于共线性的直系同源群(Syn-OGs)和基因家族资源。通过Syn-Orthogroups界面,研究人员成功鉴定了与葫芦素(Cucurbitacin)等苦味物质合成相关的候选基因及其复制事件。此外,Syn-Families界面整合了Phy-Tree和Family-Circos等工具,使用户能够深入探索特定基因家族(如细胞色素P450家族)的起源与进化,从而为作物改良提供靶点。
5. 整合了多组学数据以支持功能基因组学与分子育种
CGRP整合了物种百科、转录组、代谢组、农艺生态、文献及外部数据库资源。其中,转录组界面包含来自18个物种、53个组织的7,109个转录组数据;代谢组界面则整合了葫芦目最大规模的代谢物资源。这些多组学数据的整合,为解析基因表达模式、代谢物合成途径及关键基因功能提供了全面的支持。
6. 开发了强大的生物信息学工具集
为了增强平台的挖掘能力与易用性,研究团队开发了WinO-Tools工具集,包含49个在线生物信息学工具,其中15个为新开发的脚本。这些工具涵盖了基因组注释、进化分析及基因家族研究等多个方面,并提供了本地运行工具包(CGRP-Local-Run),以解决网络和计算资源限制问题。
结论与意义
CGRP平台的建立,标志着葫芦目基因组研究进入了一个全新的阶段。它不仅解决了因古多倍化事件导致的基因组复杂性难题,还通过整合多组学数据与开发用户友好的分析工具,为科学家们提供了一个强大的“一站式”研究平台。该平台能够有效支持葫芦目物种的进化生物学研究、重要农艺性状基因的挖掘以及分子育种实践。通过CGRP,研究人员可以更深入地理解葫芦目物种的起源与演化,并加速培育出更具抗逆性、更高产、更优质的葫芦目作物新品种,为保障粮食安全和促进农业可持续发展做出重要贡献。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号