编辑推荐:
植物代谢物在植物生长等过程意义重大,但以往研究多在控制环境下开展。研究人员针对 660 个玉米自交系,在田间条件下研究代谢物丰度变异。通过 GWAS、TWAS 等分析,找到相关基因组区间和转录本,为后续研究奠定基础。
在植物的奇妙世界里,代谢物就像一个个隐藏的小精灵,它们有着各种各样的结构,在植物的生长、细胞再生、资源分配、发育以及应对生物和非生物胁迫等过程中,都发挥着不可或缺的作用。植物能产生的代谢物数量极其庞大,超过百万种,不过每个植物物种通常只能合成几千到几万种。而且,同一物种不同个体间的代谢物也存在很大差异。研究植物代谢物的这种种内变异,不仅能帮我们了解代谢途径中具体步骤的相关酶,还能明白植物代谢变异对整个植株表型的影响。就像在拟南芥和玉米中,木质素前体丰度的变化与生物量的变化紧密相关;在番茄中,很多代谢和形态特征之间也存在显著相关性。
尽管植物代谢物如此重要,可研究起来却困难重重。以往很多试图利用自然变异来探究基因和转录本对植物代谢影响的研究,大多是在控制环境下进行的。然而,真实的田间环境复杂多变,与控制环境大不相同。在这样的背景下,来自美国内布拉斯加大学林肯分校(University of Nebraska-Lincoln)等机构的研究人员决心深入探索,他们想搞清楚在田间条件下,玉米代谢物丰度变异背后的遗传因素到底是什么。这项研究成果发表在《BMC Genomics》上,为我们打开了了解植物代谢遗传机制的新窗口。
研究人员采用了多种关键技术方法来开展这项研究。他们首先建立了田间实验,使用了威斯康星多样性面板(Wisconsin Diversity panel)中的玉米品系,这个面板包含了来自多个国家的不同玉米品系,具有丰富的遗传多样性。在实验过程中,研究人员收集了植物表型、基因表达数据和代谢物丰度数据。在代谢物定量方面,他们运用气相色谱 - 质谱联用仪(GC-MS)对玉米叶片中的代谢物进行分析。为了找出与代谢物丰度变异相关的基因区域和转录本,研究人员还利用了全基因组关联研究(GWAS)、转录组全关联研究(TWAS)以及基于随机森林(RF)的可解释人工智能方法。
研究人员在 2020 年夏天于内布拉斯加大学林肯分校的哈夫洛克农场开展了玉米田间实验。实验采用随机完全区组设计,包含 660 个来自威斯康星多样性面板的玉米品系,每个品系有两个重复。在玉米生长的特定阶段,研究人员采集了叶片样本用于后续分析。
在代谢物定量分析中,研究人员从每个实验地块选取一株代表性植株,采集其第四片叶子制作叶盘,迅速冷冻保存。经过一系列复杂的处理步骤,包括研磨、萃取、衍生化等,最终利用 GC-MS 对 26 种代谢物进行定量分析。结果发现,一些代谢物如苏氨酸(r = 0.87)、棉子糖(r = 0.82)等表现出较高的生物学重复性,不过代谢物性状的重复性普遍低于同一群体中测量的全株表型。而且,部分代谢物非遗传变异的很大比例可由不同批次样本的差异来解释。同时,研究人员还观察到不同代谢物之间存在预期的相关性,并且一些代谢物的丰度与全株表型也显著相关,比如莽草酸的丰度与植株高度呈正相关,与果穗灌浆率呈负相关。
通过 GWAS 分析,研究人员发现 150 个遗传标记与 26 种代谢物中的一种或多种显著相关,其中 17 个标记 - 代谢物关联的重采样模型包含概率(RMIP)≥0.3,有三个关联的 RMIP≥0.5 。在部分关联中,已知在植物代谢中起特定作用的基因位于与代谢变异相关的遗传标记附近 50kb 范围内,但很多情况下,与单个代谢物丰度相关的遗传标记周围的连锁不平衡窗口包含多个基因模型。
在 TWAS 分析中,研究人员利用之前发表的基因表达数据集,该数据集与代谢物定量分析所用的叶片样本来自同一植株且采集于同一时间。然而,在 26 种代谢物中,只有 3 种代谢物的丰度与叶片中单个基因的表达显著相关。研究人员推测,这可能是因为转录本丰度与代谢物水平之间存在非线性关联。
为了进一步探究这种非线性关系,研究人员采用基于 RF 的可解释人工智能方法进行分析。结果发现,分别有 26、29 和 24 个转录本与 L - 谷氨酸、奎宁酸和甘油 - 1 - 磷酸的丰度显著相关(FDR≤0.05) 。其中,N - 乙酰 - γ - 谷氨酰 - 磷酸还原酶(argC)与 L - 谷氨酸丰度的变异相关,argC 在精氨酸生物合成途径中起着关键作用。
研究人员还发现,在玉米基因组中,有三个区域既与代谢物丰度变异相关,又与非代谢性状变异相关。例如,6 号染色体上的一个区域与成熟叶片中 L - 丝氨酸丰度和收获时果穗灌浆率相关;1 号染色体上的两个区域,分别与粘酸丰度和 LV9 高光谱反射率衍生性状相关,以及与绿原酸丰度和雄穗分支数相关。
综合来看,这项研究首次在田间条件下对玉米进行大规模代谢分析,虽然存在一定局限性,比如研究结果可能无法完全推广到不同基因型或环境条件,但它为后续研究植物在不同环境下的代谢变异奠定了重要基础。研究中 GWAS 发现了许多与代谢物变异相关的遗传标记,不过将这些标记与单个高可信度候选基因联系起来仍面临挑战。TWAS 在识别转录本 - 代谢物关联方面表现不佳,可能是因为其假设的线性关系不成立,以及对低表达或稀有转录本存在偏差。基于 RF 的方法虽然能识别非线性关系的转录本,但也受到测量误差、统计效力有限等因素影响。未来的研究需要扩大样本量、增加实验重复、改进样本采集方法以及更好地处理非线性相互作用,以更深入地了解影响植物代谢和非代谢性状的遗传变异,为植物遗传改良和农业生产提供更有力的理论支持。