
-
生物通官微
陪你抓住生命科技
跳动的脉搏
生菜超级泛基因组揭示基因组进化与驯化奥秘
【字体: 大 中 小 】 时间:2025年08月08日 来源:Nature Communications 15.7
编辑推荐:
研究人员通过整合12个代表性栽培和野生生菜基因组,构建了首个高质量生菜超级泛基因组,揭示了转座子扩张导致基因组大小变异、结构变异(SVs)的表观遗传特征及其在驯化中的作用,发现开花位点C(FLC)拷贝数变异与栽培生菜开花延迟相关,为生菜功能基因组研究和分子育种提供了重要资源。
生菜作为全球广泛种植的蔬菜作物,其营养价值和低热量特性备受青睐。然而,这个重要作物的基因组进化和驯化机制仍存在诸多未解之谜。尽管已有部分生菜基因组被测序,但由于其基因组复杂(大小从2.1Gb到5.5Gb不等)且富含重复序列,这些基因组在连续性和完整性方面存在差异,难以全面揭示生菜基因组进化和驯化的全貌。此外,DNA甲基化在基因组稳定性和结构变异(SVs)形成中的作用,以及驯化过程中关键性状的遗传基础仍不清楚。
为解决这些问题,Temasek Life Sciences Laboratory的研究人员开展了系统性研究。他们通过整合PacBio HiFi长读长测序和高通量染色体构象捕获(Hi-C)技术,从头组装了10个高质量染色体级别基因组,涵盖5个栽培生菜形态型(结球、散叶、罗马、拉丁和油用生菜)、1个地方品种和4个近缘野生种(毒莴苣、野莴苣等)。结合已发表的2个栽培生菜基因组,构建了首个生菜超级泛基因组和基于图形的参考基因组。研究发现转座子扩张(特别是LTR反转录转座子)是导致野生种L. indica基因组显著增大(5.5Gb)的主要原因,这与CHH甲基化水平降低和CMT2基因表达下调相关。通过分析37,456个泛基因家族,发现驯化过程中保留的基因富集于DNA复制和生物胁迫响应通路,而丢失的基因则与温度响应和蛋白定位相关。研究还鉴定出506,004个与驯化相关的结构变异簇,其中FLC基因拷贝数增加(栽培生菜5-8个拷贝vs野生种3个拷贝)与开花延迟性状相关。该研究为生菜功能基因组研究和分子育种提供了宝贵资源,相关成果发表在《Nature Communications》上。
关键技术方法包括:(1)整合PacBio HiFi和Hi-C数据组装染色体级别基因组;(2)基于RNA-seq、同源预测和从头预测的基因注释;(3)使用OrthoFinder进行直系同源基因聚类和进化分析;(4)LTR_retriever分析转座子插入时间;(5)甲基化测序(MethylC-seq)分析DNA甲基化模式;(6)基于图形基因组(graph genome)的结构变异检测。
研究结果部分的主要发现:
"High-quality genome assembly of representative lettuce morphotypes and wild relatives":组装的10个基因组大小从2.1Gb(L. saligna)到5.5Gb(L. indica)不等,contig N50平均达20Mb,99.6%序列锚定到9条假染色体上。野生种间基因组共线性低,特别是L. indica与栽培生菜差异显著。

"Super-pangenome of lettuce":鉴定37,456个泛基因家族,其中42%为核心基因(所有12个基因组共有),3%为品种特异基因。驯化保留基因富集于DNA复制等过程,而丢失基因与温度响应相关。

"Similar diploidization effect across the Lactuca genus":全基因组三倍化(WGT)基因占14.8%,在核心基因中比例更高(34.8%),这些基因具有低CG甲基化和高表达特性,可能在二倍化过程中被选择性保留。

"Transposon expansion contributing to genomic size":L. indica基因组中LTR占比最高(89.1%),其Copia元件近期多次扩张,这与CHH甲基化
生物通微信公众号
知名企业招聘