
-
生物通官微
陪你抓住生命科技
跳动的脉搏
桃多组学数据库PeachMD:推动桃分子育种与功能基因组学研究的综合平台
【字体: 大 中 小 】 时间:2025年07月05日 来源:Molecular Horticulture 10
编辑推荐:
为解决桃(Prunus persica)多组学数据分散、分析门槛高的问题,中国农业科学院团队开发了首个综合性桃多组学数据库PeachMD。该平台整合12个参考基因组、329组转录组、101组全基因组甲基化测序(WGBS)及1313组重测序数据,提供GWAS、TE分析等工具,支持候选基因挖掘与分子育种研究,填补了桃资源整合领域的空白。
桃作为全球重要的温带果树和蔷薇科多年生木本植物模式物种,其遗传研究对果树改良具有重要意义。尽管已有12个桃基因组完成测序,高通量测序技术也产生了海量基因组、转录组和表观遗传数据,但这些资源分散在不同平台,分析流程不统一,使得研究者面临数据获取困难、计算资源不足等挑战。
中国农业科学院团队构建了全球最全面的桃多组学数据库PeachMD。该平台基于MySQL和Flask框架开发,整合12个参考基因组(涵盖改良品种、地方品种和野生类型)、329组转录组、101组全基因组亚硫酸氢盐测序(WGBS)和1313份重测序数据,所有数据经过统一流程重新分析以确保一致性。研究团队还收录了852份种质资源的13类表型数据,包括果实重量、可溶性固形物含量等农艺性状,并通过可视化GWAS结果揭示性状相关基因。
关键技术包括:1) 多组学数据整合与标准化处理;2) 基于Nginx的高效架构设计;3) 全基因组关联分析(GWAS)与选择信号检测(Pi、FST、XPCLR);4) 转座子(TE)分类与功能注释;5) DNA甲基化水平(CG/CHG/CHH上下文)分析。
Genomes模块
提供12个参考基因组的基因注释、功能预测及序列下载功能,支持启动子区(2 kb)、CDS和蛋白序列提取。通过Genome Synteny工具可比较任意两个基因组的共线性区块,为基因丢失与获得研究提供依据。
Transposable element(TE)模块
系统注释了桃基因组中转座元件的分类、序列和位置信息,为研究基因组变异和驯化适应机制提供资源。

Germplasm模块
整合全球852份种质资源的表型与基因型数据,支持基于地理分布的性状查询。Variation模块可快速检索1313份材料的SNP、Indel和SV变异,GWAS结果则通过曼哈顿图展示26个性状的显著关联位点。
Transcriptome模块
包含329组转录组数据(57组为团队自产),支持FPKM/TPM/read count多维度查询,通过热图、折线图等可视化工具揭示基因表达模式,助力功能网络解析。
Tools模块
集成10种分析工具,包括:1) 转录因子/调控因子(TF/TR)数据库;2) 基因区域甲基化水平分析;3) KEGG/GO富集;4) CRISPR靶点设计等。
该研究创建的PeachMD是首个面向桃研究的综合性多组学平台,其价值体现在三方面:1) 打破数据孤岛,统一分析标准;2) 降低生物信息学分析门槛,特别是对湿实验室团队;3) 通过案例演示多组学数据整合方法(如果实性状候选基因挖掘)。数据库将持续更新基因组和组学数据,为桃的分子设计育种和比较基因组学研究提供核心支撑。论文发表于《Molecular Horticulture》,通讯作者为Zeng Wenfang团队。
生物通微信公众号
知名企业招聘