编辑推荐:
在油菜等油料作物中,种子成熟是关键发育过程。为探究相关基因表达动态,研究人员对 5 个甘蓝型油菜基因型开展 RNA-seq 时间序列研究,获 240 份样本数据,构建 SeedORDER 资源。该成果为育种提供基因表达依据,助力提升种子质量与油产量。
在油料作物的生产与研究中,种子质量和油产量是备受关注的核心问题。种子发育过程复杂,涉及细胞分裂、分化以及油脂在胚、胚乳和种皮等特定组织中的积累,而基因在不同组织和发育阶段的特异性表达调控着这一系列过程。然而,由于甘蓝型油菜(Brassica napus)等 Brassica 物种基因组存在大量重复区域,其与拟南芥(Arabidopsis)基因存在多个直系同源物,且部分同源物在进化和驯化过程中可能发生功能分化,使得难以直接将拟南芥中积累的丰富研究知识应用于 Brassica 作物。因此,深入研究 Brassica 物种种子发育过程中的基因表达动态,对于明确不同同源基因的功能、指导油菜等作物的遗传改良具有重要意义。
为解决上述问题,英国约翰英纳斯中心(John Innes Centre)和洛桑研究所(Rothamsted Research)的研究人员开展了相关研究。他们选取了包括冬性、半冬性、春性油菜品种,一个甘蓝型油菜传统羽衣甘蓝品种以及一个快速循环双单倍体甘蓝(B. oleracea)品系在内的 5 个 Brassica 基因型,对种子发育过程中从心形期到成熟阶段的多种组织进行了研究,相关成果发表在《Scientific Data》上。
研究人员采用了一系列关键技术方法。首先,在受控环境条件下种植植物,对冬性和半冬性基因型进行春化处理(vernalisation)。然后,收集包括胚、胚乳、种皮等在内的 16 种不同组织样本,每个时间点和组织类型进行 3 次生物学重复。通过 TRIzol 试剂提取高质量总 RNA,经 DNA 酶处理后,利用 Illumina NovaSeq 6000 进行 RNA-seq 测序,共获得 240 份样本数据。数据处理过程中,使用 FastQC 进行质量控制,通过 Trimmomatic、HISAT2 和 StringTie 等工具进行序列比对和基因表达定量分析。
基因型特异性相关性分析与主成分分析
通过热图分析样本间的皮尔逊相关系数(Pearson correlation coefficient),发现每个基因型和组织的三个重复样本具有高度相关性,表明重复样本质量良好。主成分分析(principal component analysis, PCA)显示,所有基因型中各组织的三个重复样本均聚集在一起,进一步验证了样本的高完整性。预受精组织(如顶端、叶片、雌蕊壁和胚珠)与种子特异性样本(胚、胚乳和种皮)分开聚类,果壁通常与叶片样本聚类最近。在种子组织中,心形期和鱼雷期的胚和胚乳聚类较近,而绿色阶段组织类型聚类较远,表明心形期和鱼雷期的调控通路更为相似,且向绿色阶段存在特定的转录组转变。成熟胚和成熟种皮的聚类接近,可能表明这些组织中基因表达谱的趋同。
已知种子发育组织参考基因的表达
将研究获得的转录组数据与拟南芥表达浏览器中的已知种子标记基因表达进行比较,证实了数据集的组织特异性。例如,拟南芥中已知在种子胚中表达的 AINTEGUMENTA-LIKE 5(AIL5),其 Brassica 直系同源物在胚中的表达随成熟度升高,而在种皮和胚乳中表达极低;种子种皮特异性的 FIDDLEHEAD(FDH),其 Brassica 同源物在种子发育的心形期和鱼雷期高表达;胚乳特异性的 MYB 转录因子 MYB118,其 Brassica 同源物表达谱与拟南芥一致,进一步验证了实验结果的可靠性。
数据存储与资源访问
原始 RNA-seq 数据已存入欧洲核苷酸档案馆(ENA),登录号为 PRJEB86494。同时,研究人员提供了 Seed Oilseed Rape Developmental Expression Resource(SeedORDER),用户可通过该资源搜索感兴趣的基因并可视化表达模式。
研究通过对多个 Brassica 基因型种子发育过程中组织特异性基因表达动态的深入分析,构建了全面的转录组数据集,揭示了不同发育阶段和组织的基因表达特征,为理解 Brassica 物种种子发育的分子机制提供了丰富的数据资源。该研究不仅有助于解析基因在种子发育中的功能,还为利用基因表达信息指导油菜等作物的遗传育种、提高种子质量和油产量奠定了基础。此外,SeedORDER 资源的建立为相关研究提供了便捷的工具,促进了 Brassica 作物分子生物学研究和育种实践的发展。