优质花生(Arachis hypogaea)栽培品种中花5(ZH05)高质量基因组揭示亚基因组不对称性、泛基因组多样性及育种启示

《Journal of Integrative Plant Biology》:High-quality genome of elite peanut cultivar ZH05 reveals subgenome asymmetry, pan-genome diversity, and breeding insights

【字体: 时间:2026年06月12日 来源:Journal of Integrative Plant Biology 9.3

编辑推荐:

  摘要:花生(Arachis hypogaea)是全球重要的经济与农业豆类作物。尽管花生基因组学研究已取得进展,但遗传多样性与多组学景观的整合仍较有限,对亚基因组不对称性(subgenome asymmetry)的全面理解尚缺。本研究报道了优质花生栽培品种中花5

  
摘要:花生(Arachis hypogaea)是全球重要的经济与农业豆类作物。尽管花生基因组学研究已取得进展,但遗传多样性与多组学景观的整合仍较有限,对亚基因组不对称性(subgenome asymmetry)的全面理解尚缺。本研究报道了优质花生栽培品种中花5(ZH05)的高质量基因组组装(2,622.85 Mb,预测基因73,718个),并基于1,286份种质构建了物种特异性泛基因组(pan-genome),发现849.82 Mb非参考序列(non-reference sequences)及18,484个新基因。超过2,300万个遗传变异和广泛的基因存在/缺失变异(presence–absence variations, PAVs)显著拓展了花生遗传多样性图谱。整合多组学[转录组、DNA甲基化、染色质可及性(chromatin accessibility)及三维(3D)基因组架构]结合群体基因组分析,揭示了显著且多层次的亚基因组不对称性:SubA(源自A. duranensis,AA基因组)具有更高的染色质可及性和整体基因表达水平;而SubB(源自A. ipa?nsis,BB基因组)含有更多转座子(transposable elements, TEs)、更高的DNA甲基化水平、更多受驯化选择的基因,以及更强的三维染色质互作和更稳定的拓扑关联结构域(topologically associating domains, TADs)。此外,利用重组自交系(recombinant inbred line, RIL)群体进行遗传剖析,鉴定到数个控制种子大小的稳定主效数量性状位点(quantitative trait loci, QTLs),其聚合贡献于ZH05的优异产量表现。综上,本研究建立了花生综合基因组框架,阐明了跨越序列、表观遗传及染色质架构层面的亚基因组进化不对称性,并为加速分子育种和作物改良提供了宝贵资源。
论文解读:优质花生栽培品种中花5(ZH05)高质量基因组揭示亚基因组不对称性、泛基因组多样性及育种启示
花生(Arachis hypogaea, 2n=4x=40, AABB)是重要异源四倍体豆科作物及植物油脂和蛋白质来源。其起源于二倍体祖先A. duranensis(AA)与A. ipa?nsis(BB)的杂交及染色体加倍事件,野生异源四倍体A. monticola被认为是其未驯化祖先。异源多倍体作物普遍存在亚基因组不对称性(subgenome asymmetry),表现为同源基因表达偏向、表观遗传分化及结构变异偏好等,但花生中亚基因组不对称性的系统表征,尤其是跨表观修饰、染色质可及性与三维(three-dimensional, 3D)基因组架构层面的解析仍较缺乏。此外,花生基因组较大(~2.8 Gb)且高重复序列含量(~77%)使组装困难,已有参考基因组有限,泛基因组(pan-genome)构建多基于少数材料,难以全面反映种内遗传多样性和基因存在/缺失变异(presence–absence variation, PAV)。为此,研究人员以我国广泛种植的高产优良亲本品种中花5(ZH05)为对象,完成了染色体级高质量基因组组装,整合转录组、DNA甲基化、染色质可及性(assay for transposase-accessible chromatin using sequencing, ATAC-seq)及Hi-C(high-throughput chromosome conformation capture)多组学检测与779份种质重测序群体基因组学分析,并基于1,286份栽培种重测序数据构建大规模泛基因组,最后利用ZH05×ICGV86699重组自交系(recombinant inbred line, RIL)群体进行种子性状的数量性状位点(quantitative trait locus, QTL)定位,以揭示花生亚基因组进化不对称机制及高产遗传基础。该论文发表于Journal of Integrative Plant Biology
主要关键技术方法:
研究人员选用花生优良栽培品种Zhonghua 5(ZH05)及RIL群体(ZH05×ICGV86699, 170个株系),对ZH05进行PacBio HiFi长读长测序、Illumina短读长测序及Hi-C scaffolding完成染色体级基因组组装与注释;取ZN05八种组织进行RNA-seq转录组测序、叶片ATAC-seq染色质可及性检测、叶片Hi-C 3D基因组测序及全基因组胞嘧啶甲基化测序;收集已发表779份花生种质(含野生、国外与国产栽培种)重测序数据比对至ZH05参考基因组进行群体结构、连锁不平衡(linkage disequilibrium, LD)及选择性清除(selective sweep)分析;利用1,286份栽培花生重测序数据经de novo组装构建泛基因组并分析PAV;采用高密度遗传图谱(3,157个bin标记)对RIL群体8个环境下表型(百粒重hundred-seed weight, HSW;种子长seed length, SL;种子宽seed width, SW;含油率oil content, OC;脂肪酸组成)进行QTL定位。
研究结果
High-quality genome assembly and annotation of ZH05(ZH05高质量基因组组装与注释)
研究人员利用PacBio HiFi(89.81 Gb)初步组装,经NextPolish2和Pilon利用HiFi及Illumina(231.02 Gb) reads纠错抛光,再通过Hi-C(364.54 Gb)将95条contig挂载至20条染色体(SubA: Chr01–Chr10; SubB: Chr11–Chr20),填补缺口并整合同源置换(homoeologous replacement, HR)序列。最终基因组总长2,622.85 Mb,contig N50达57.94 Mb,98.81%序列锚定至染色体。BUSCO评估 Embryophyta保守基因完整度99.26%,LAI(LTR assembly index)评分22.58,符合黄金标准参考基因组。重复序列占79.05%(其中逆转录转座子61.35%),注释获得73,718个蛋白编码基因,99.59%定位于染色体,75.83%获RNA-seq支持,93.34%具功能注释。结论:ZH05基因组在连续性、完整性与准确性上优于多数已发表花生基因组,为进化与功能基因组研究提供可靠参考。
Comparative genomics and phylogenetic relationships(比较基因组学与系统发育关系)
基于2,661个单拷贝直系同源基因构建系统树,SubA与SubB分属两支独立分支;ZH05在SubA支与中国栽培种聚类,SubB支与部分中国栽培种聚为一类,A. monticola介于中外类群间。共线性分析显示从二倍体祖先经A. monticola至现代栽培种染色体共线性强且保守。结论:花生亚基因组在物种形成后保留了清晰的二倍体起源信号,中国栽培种与部分国外种存在分化及可能的独立驯化轨迹。
Genome-wide structural variations(全基因组结构变异)
ZH05与YZ9102共线性最高,仅检出少量大片段倒位与易位;相对于其他栽培种检测到45.65–298.74 Mb结构变异(structural variations, SVs),SV富集于SubB。2,482个与SV重叠的基因中SubB(1,618个)多于SubA(864个),功能富集于次生代谢、能量转换与发育调控通路。结论:SubB具有较高的结构变异性,SV参与栽培花生种质间的基因组多样性塑造。
Subgenome asymmetry in transposable elements, gene expression, and DNA methylation(转座子、基因表达与DNA甲基化层面的亚基因组不对称性)
SubB中转座子特别是Ty3/Gypsy型LTR(long terminal repeat)逆转录转座子含量更高且近期有两波扩增峰;基因侧翼区TE密度SubB高于SubA。八组织转录组显示SubA整体基因表达水平更高,而23,846对同源基因对中表达偏向SubB者居多。加权基因共表达网络分析(weighted gene co-expression network analysis, WGCNA)表明SubB同源基因组内互作更强,SubA基因更多与另一亚基因组交叉连接。CG、CHG、CHH三型胞嘧啶甲基化在SubB基因体及启动子区均显著高于SubA,含启动子TE插入的基因甲基化升高更明显(尤见于SubA)。启动子区非对称TE插入的同源基因对更易出现表达偏向。结论:花生亚基因组呈现协调而复杂的不对称——SubA具更开放转录环境,SubB受更高TE负荷与DNA甲基化影响,TE驱动的表观重塑可能是亚基因组调控分化的基础。
Subgenome asymmetry in chromatin accessibility and 3D genome architecture(染色质可及性与3D基因组架构的亚基因组不对称性)
ATAC-seq鉴定24,867个可及染色质区域(accessible chromatin regions, ACRs),SubA的ACR密度高于SubB,同源基因对转录起始位点(transcription start site, TSS)附近染色质可及性SubA更强。启动子含ACR影响同源基因表达偏向,SubA启动子ACR甲基化更低、可及性信号更强。Hi-C显示SubB内染色质互作强于SubA,且亚基因组内互作大于亚基因组间;A/B区室(compartment)分析SubB中A区室比例略高,同源基因对中SubA→SubB由B向A区室转换多于反向;在25 kb分辨率鉴定拓扑关联结构域(topologically associating domain, TAD),SubB含更多更大TAD且TAD边界绝缘分数(insulation score)更低(边界更清晰稳定);在5–10 kb分辨率鉴定15,444个染色质环(loop),SubB中基因–基因(genenic–genic, G–G)型环更多。相同染色质状态(A区室/TAD边界/loop锚点)下SubA基因表达高于SubB、DNA甲基化更低、染色质可及性更强。结论:SubA通过较高染色质可及性实现活跃局部转录调控,SubB则维持更稳定紧缩的全局3D染色质架构,二者采用不同调控策略。
Evolutionary divergence and subgenome-biased selection(进化分歧与亚基因组偏向性选择)
从二倍体至A. monticola阶段SubA经受更强纯化选择(较低Ka/Ks),驯化阶段(A. monticolaA. hypogaea)SubB有更多基因可计算Ka/Ks暗示更快序列分化;保守基因(低Ka/Ks)倾向高表达、低甲基化。群体基因组显示SubB变异密度(SNP 0.53 SNP/kb vs SubA 0.41 SNP/kb)与遗传多样性更高,LD衰减快于SubA。选择性清除扫描SubB较SubA含更多受选基因(除南北中国栽培种比较外),两亚基因组受选基因重叠少。结论:SubB在驯化和育种选择中发挥更关键作用,具更高遗传多样、更快重组及偏向性选择信号,亚基因组进化轨迹不对称。
Pan-genome construction and gene presence–absence variation(泛基因组构建与基因PAV分析)
整合1,286份栽培种重测序de novo组装比对参考基因组获849.82 Mb非参考序列(non-reference sequence, NRS),含18,484个新预测蛋白编码基因;最终泛基因组3,441.42 Mb、91,898个基因。743份栽培种PAV分类:核心(core)44,721个(54.04%)、软核(softcore)27,747个(33.53%)、可变(dispensable)5,407个(5.63%)、私有(private)4,875个(5.89%)。SubA核心基因比例更高,SubB可变基因更多——SubB基因内容可塑性更强。NRS来源基因与SubA同源基因相似度更高。核心至私有基因注释率与长度递减、核苷酸多样性与Ka/Ks递增、表达水平递减。可变基因富集于逆境响应与特化代谢。结论:泛基因组揭示广泛种内序列与基因含量多样性,再次印证亚基因组不对称延伸至PAV与进化特征。
Genetic dissection of seed traits in the Elite Cultivar ZH05(优异栽培种ZH05种子性状遗传剖析)
RIL群体多环境QTL定位鉴定四个稳定主效种子大小QTL:qSS.Chr07(解释HSW 14.42%, SW 15.13%)、qSS.Chr08(HSW 15.01%, SW 15.40%)、qSS.Chr16.2(HSW 13.92%, SL 22.97%)、qSS.Chr16.3(HSW 15.42%, SW 14.69%),其中qSS.Chr07qSS.Chr16.3候选基因为已报道AhPSW1AhPDS1并验证单倍型效应。含油率无跨环境稳定QTL,两处Chr08位点具较大效应接近已知油分QTL区间。脂肪酸组成QTL包括不饱和与长链脂肪酸相关位点,FAD2A位于qFA.Chr09.2但ZH05不携带高油酸突变。结论:多个大效应种子大小有利等位基因聚合是ZH05高产的重要遗传基础。
讨论与结论翻译
研究人员指出,本研究产生了目前最完整之一的花生染色体级参考基因组并构建了基于1,286份栽培种的大规模泛基因组,极大拓展了对栽培花生遗传与基因内容多样性的认知。多组学整合分析揭示花生亚基因组呈现多层次不对称:SubA具更高染色质可及性、更低DNA甲基化及更高整体基因表达,暗示更活跃的局部转录调控;SubB含更多TE(尤其Ty3/GypsyLTR)及更高甲基化、更强3D互作、更稳定TAD边界、更多受驯化选择基因及更高遗传多样性——反映其在适应与人工选择中作用突出。这种不对称性可能源于异源多倍化早期TE在SubB的扩增引发的表观与结构重塑。种子大小多位点QTL的鉴定及有利等位基因聚合解释了ZH05的高产特性。综上,本研究建立的整合基因组框架深化了对异源多倍体亚基因组进化不对称的理解,为花生功能基因组研究与分子设计育种提供了重要平台与资源。
相关新闻
生物通微信公众号
微信
新浪微博

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号