解析重楼转录组与代谢组:揭示重楼皂苷生物合成新机制

【字体: 时间:2025年02月16日 来源:BMC Plant Biology 4.3

编辑推荐:

  为探究重楼属植物中重楼皂苷(polyphyllins)的合成机制,云南中医药大学的研究人员开展转录组和代谢组研究。结果鉴定出 17 个相关候选基因。该研究为解析其合成通路提供依据,对重楼资源利用及相关药物研发意义重大,值得一读。

  
云南中医药大学(第一作者 Ping Xu 单位)的研究人员在《BMC Plant Biology》期刊上发表了题为 “Dissection of transcriptome and metabolome insights into the polyphyllin biosynthesis in Paris” 的论文。这篇论文在药用植物研究领域意义重大,为深入探究重楼属植物中重楼皂苷(polyphyllins)的生物合成机制提供了新的思路和依据,有望推动相关药物的研发和重楼属植物资源的合理利用 。

研究背景


重楼属(Paris)植物种类繁多,超过 26 种,但在《中华人民共和国药典》(2020 年版)中,仅收录了华重楼(Paris polyphylla var. Chinensis )和滇重楼(Paris polyphylla var. yunnanensis )作为药用原料,它们被广泛应用于云南白药、宫血宁胶囊等 79 种以上的商业制剂中。此外,诸如法氏重楼(Paris fargesii Franch)和长柱重楼(Paris forrestii (Takht.) H. Li)等其他重楼属植物也具有显著的药用价值。法氏重楼被收录于《2014 年四川省藏药材标准》,是四川省的法定药用材料;长柱重楼则在《云南植物志》中被记载可用于治疗肿胀、腮腺炎和扁桃体炎等疾病。

重楼皂苷被视为重楼属植物的主要活性成分,不同种类的重楼所含重楼皂苷的含量和组成差异显著 。而且,不同的重楼皂苷具有独特的生物活性。比如,重楼皂苷 I 能够抑制炎症因子,对改善关节炎、肺损伤以及细菌诱导的炎症等病症有积极作用,还能抑制前列腺癌、胃癌和鼻咽癌等多种癌细胞的生长和侵袭;重楼皂苷 II 可调节免疫系统,增强自然杀伤细胞的活性,对肺癌、胶质瘤和结直肠癌等癌细胞具有显著的抗增殖和促凋亡作用;重楼皂苷 III 能诱导三阴性乳腺癌细胞发生铁死亡;重楼皂苷 V 展现出比传统抗生素更优越的抗菌活性;纤细薯蓣皂苷(Gracillin)可用于治疗特应性皮炎,改善皮肤屏障功能;重楼皂苷 VI 能诱导骨肉瘤 U2OS 细胞凋亡和自噬,还能缓解慢性炎症疼痛;重楼皂苷 VII 对卵巢癌细胞具有显著的抗癌活性;重楼皂苷 H 则能增强凝血酶活性,提高纤维蛋白原水平,促进止血,同时抑制 U251 胶质瘤细胞的增殖。

尽管重楼皂苷的药用价值备受关注,但其合成机制却尚不明确。重楼皂苷的生物合成涉及 11 种生物酶,包括 2,3 - 氧化角鲨烯环化酶(2,3-oxidosqualene cyclases,OSCs)、甾醇侧链还原酶(sterol side chain reductase,SSR)、C - 4 甾醇甲基氧化酶(C-4 sterol methyl oxidase,SMO)等 。此前研究发现,滇重楼的根茎富含重楼皂苷 I 和 II,长柱重楼富含重楼皂苷 III,法氏重楼则含有高水平的重楼皂苷 VI、VII 和 H。这些重楼属植物在代谢组和转录组方面存在明显差异,为研究重楼皂苷的合成提供了理想的样本。综合代谢组学和转录组学分析是探索特定代谢途径及其调控基因的有效策略,基于此,该研究团队开展了此项研究,旨在鉴定重楼属植物中参与重楼皂苷生物合成的关键基因。

研究方法


  1. 植物材料:研究人员采集了 7 年生的法氏重楼(PFa)、长柱重楼(PFo)以及滇重楼 3 个品种(分别命名为 PP1、PP2、PP3,代表低、中、高重楼皂苷含量)的根茎。采集后,将新鲜根茎洗净、去除沉积物和须根,随后迅速放入液氮中速冻,并保存于 - 80°C,用于后续的转录组和代谢组分析。
  2. 基于 UPLC - MS/MS 的代谢组学分析:精确称取每个样品 50mg 的根茎粉末,加入 1.2mL 预冷至 - 20°C 的 70% 甲醇 - 水内标提取物,每隔 30 分钟涡旋 30 秒,共进行 6 个循环。之后,以 12,000rpm 的转速离心 3 分钟,收集上清液,再通过 0.22μm 微孔滤膜过滤到液相小瓶中,用于超高效液相色谱(Ultra - Performance Liquid Chromatography,UPLC)和串联质谱(Tandem Mass Spectrometry,MS/MS)分析。UPLC 采用 Agilent SB - C18 色谱柱(2.1mm×100mm,1.8μm),流动相由溶剂 A(含 0.1% 甲酸的纯水)和溶剂 B(含 0.1% 甲酸的乙腈)组成,按照特定的洗脱梯度进行洗脱,流速设定为 0.35mL/min,柱温保持在 40°C,进样量为 2μL。ESI 源在特定参数下运行,通过多反应监测(Multiple Reaction Monitoring,MRM)实验进行 QQQ 扫描,并对每个 MRM 转换的去簇电压(DP)、碰撞能量(CE)等参数进行优化。
  3. 代谢物的鉴定和定量分析:运用 Analyst 1.6.3 软件处理质谱数据,利用 Metware Database(MWDB)数据库对样品中的代谢物进行定性和定量分析。广泛靶向代谢组分析基于 MRM 扫描,通过 DP、CE、保留时间(RT)、母离子质荷比(Q1)和子离子质荷比(Q3)这 5 个参数检测物质。使用 Multiquanta 软件打开原始质谱文件,对色谱峰进行积分、校正,并计算峰面积以代表相应物质的相对含量。随后,运用 R 语言中的统计函数进行无监督主成分分析(Principal Component Analysis,PCA)和偏最小二乘法判别分析(Orthogonal Projections to Latent Structures Discriminant Analysis,OPLS - DA),基于投影变量重要性(VIP≥1)值和绝对 log2 倍变化(|log 2 FC|≥2 或≤0.5)指标鉴定两组之间的差异表达代谢物(Differentially Expressed Metabolites,DEMs)。将 DEMs 映射到京都基因与基因组百科全书(Kyoto Encyclopedia of Genes and Genomes,KEGG)代谢途径进行通路和富集分析,对显著调节代谢物的途径进行代谢物集富集分析(Metabolite Sets Enrichment Analysis,MSEA),以超几何检验的 P 值判断显著性。所有原始代谢组数据已上传至 Metabolites 数据库,项目编号为 MTBLS10682。
  4. 文库构建和 RNA 测序:构建文库时,收集约 1μg 的总 RNA,按照 cDNA 合成试剂盒的说明书生成 150bp 的双端测序读长。去除 cDNA 两端缺少接头的序列,将引物与 DNA 聚合酶结合构建完整的 SMRT bell 文库,然后使用 PacBio 测序仪对全长转录组进行测序。获取三代离线数据后,利用官方 PacBio 软件包 SMRTlink 处理原始离线数据;获取二代离线数据后,进行数据质量控制,去除接头序列和低质量测序读长。得到高质量的干净数据后,用二代测序数据校正三代转录本,并选择高质量读长在 Illumina 平台上测序,生成用于进一步分析的原始数据。所有原始 RNA - seq 数据已存入 GSA,生物项目编号为 CRA016413 和 CRA016359。
  5. 差异表达基因的鉴定和富集分析:使用 RSEM 软件计算单基因的每千碱基转录本每百万映射片段的片段数(Fragments Per Kilobase of transcript per Million mapped fragments,FPKM)值,以此确定每个样品中的基因表达水平。运用 DESeq2 R 软件包(版本 1.22.2)识别不同对照组之间的差异表达基因(Differentially Expressed Genes,DEGs),采用 Benjamini - Hochberg 方法调整多重假设检验的概率(P 值),计算错误发现率(False Discovery Rate,FDR)。差异表达基因的筛选标准设定为 | log2Fold Change|≥1 且 FDR 阈值小于 0.05。为进一步阐明差异表达基因的生物学功能,进行 KEGG、基因本体论(Gene Ontology,GO)和真核生物直系同源组(euKaryotic Orthologous Groups,KOG)通路富集分析,同时使用 iTalk 软件预测与差异表达基因相关的转录因子(Transcription Factors,TFs)。
  6. 转录组测序和定量实时荧光定量聚合酶链式反应(RT - qPCR):为验证 RNA - seq 数据的可靠性,选取 18 个基因进行 RT - qPCR 测试,每个基因进行 3 次技术重复。根据 PacBio 测序数据设计引物,选择表达丰度高、稳定性强且受 RNA 降解影响小的 TUA 作为内参基因。使用 QIAGEN 试剂盒进行 RT - qPCR 反应,反应条件为:94°C 预变性 2 分钟,然后进行 40 个循环(95°C 变性 5 秒,60°C 退火延伸 30 秒),采用 2-ΔΔCt 方法计算目标基因的相对表达量。
  7. 加权基因共表达网络分析(WGCNA)和系统发育分析:运用 WGCNA R 包(版本 1.71)进行加权基因共表达网络分析,设置合并模块高度阈值(mergeCutHeight)为 0.25,相关系数平方阈值(RsquaredCut)为 0.85,拓扑重叠矩阵类型(TOMType)为 “signed”,最小模块大小为 50。利用 NCBI 平台上的 BLAST 工具识别 OSCs、CYPs 和 UGTs 的转录本,使用 MEGA 11 软件构建系统发育树,并进行 1000 次自展重抽样分析评估系统发育拓扑结构的稳健性,最后通过 ChiPlot 网站对系统发育树进行优化。
  8. 数据分析:使用 Excel 2021 对原始数据进行分析,运用 SPSS 19.0 软件进行单因素方差分析(one - way ANOVA),采用 Fisher 最小显著差异(Least Significant Difference,LSD)法确定显著性。利用 Origin 2019 软件和 TBtools 软件进行热图的可视化分析。

研究结果


  1. 不同重楼植物的代谢物组成各异:研究人员采用基于超高效液相色谱和串联质谱的广泛靶向代谢组学方法,对不同重楼属植物的代谢物变化进行研究。共检测到 1243 种代谢物,分为氨基酸及其衍生物、生物碱、酚酸、类固醇、脂质、核苷酸及其衍生物、有机酸、萜类化合物、黄酮类化合物、木脂素和香豆素、醌类以及其他等 12 类,其中重楼皂苷属于类固醇代谢物。氨基酸及其衍生物、酚酸、生物碱、黄酮类化合物、类固醇和脂质是主要的代谢物类型。不同重楼属植物在代谢物含量上存在显著差异,例如滇重楼中生物碱含量显著低于长柱重楼,而黄酮类化合物含量则显著高于长柱重楼;法氏重楼中类固醇和萜类化合物的含量显著低于滇重楼和长柱重楼。

通过比较不同样品间的代谢物,发现多个差异表达代谢物(DEMs)。在不同滇重楼品种的比较中,PP3 与 PP1 相比有 399 个 DEMs,PP3 与 PP2 相比有 369 个 DEMs,PP2 与 PP1 相比有 294 个 DEMs,表明高皂苷含量的滇重楼(PP3)相较于低皂苷含量的滇重楼,上调的代谢物数量明显更多。在与其他重楼属植物的比较中,法氏重楼与 PP3 相比有 464 个 DEMs,长柱重楼与 PP3 相比有 511 个 DEMs,长柱重楼与法氏重楼相比有 477 个 DEMs,说明长柱重楼相较于滇重楼,上调的代谢物数量最多,其次是法氏重楼。此外,同一重楼属物种含有 56 种相同的代谢物,不同滇重楼品种间以及不同重楼属物种间还存在特定的差异代谢物。

对差异表达代谢物进行 KEGG 富集分析发现,法氏重楼与 PP3 比较时,DEMs 主要富集在嘌呤代谢、黄酮和黄酮醇生物合成以及核苷酸代谢等途径;长柱重楼与 PP3 比较时,主要富集在硫代葡萄糖苷生物合成、黄酮和黄酮醇生物合成以及氨酰 - tRNA 生物合成等途径;长柱重楼与法氏重楼比较时,主要富集在黄酮类生物合成途径。研究还发现,作为重楼皂苷重要前体的薯蓣皂苷元(diosgenin)和重楼皂苷乙(trillin)的水平在不同重楼属植物中发生显著变化,且这些变化与之前通过高效液相色谱(HPLC)分析测得的重楼皂苷含量变化一致。
2. 三种重楼属植物的转录组特征不同:所有样品的合并干净数据超过 13Gb,测序错误率低于 0.03%,Q30 比例超过 93%,表明测序数据质量良好,适合进一步分析。转录组组装后,对所有单基因进行鉴定和功能注释,与多个数据库进行比对,结果显示 42,771 个转录本中,大部分单基因在不同数据库中得到注释,其中 40,945(95.73%)个单基因至少在一个数据库中被注释。

通过主成分分析(PCA)发现,5 种重楼属植物的样品明显分为不同的组。研究共鉴定出 30,097 个差异表达基因(DEGs),在不同滇重楼品种的比较中,PP3 与 PP2 比较时差异表达基因数量最多,PP2 与 PP1 比较时差异表达基因数量最少。与其他两种重楼属植物相比,低皂苷含量的滇重楼(PP1)基因表达差异最为显著,高皂苷含量的滇重楼(PP3)表达差异最小。KEGG 富集分析表明,差异表达基因主要富集在次生代谢物生物合成、淀粉和蔗糖代谢等途径,许多差异表达基因还富集在萜类骨架生物合成、倍半萜和三萜生物合成以及类固醇生物合成等与重楼皂苷生物合成密切相关的途径中,且不同重楼属植物在类固醇生物合成途径上存在显著差异。
3. 代谢物和基因共表达分析预测功能基因:基于共表达网络分析结果,选择软阈值 β = 18 构建共表达网络,并生成聚类树,将表达模式相似的单个基因聚为同一模块,最终将 28,607 个单基因分为 21 个模块。通过广泛靶向代谢组学检测 3 种重楼属植物中 6 种重楼皂苷(重楼皂苷 I、II、III、VI、VII 和 H)的产生情况,发现其分布模式与 HPLC 检测结果相似。结合重楼皂苷的分布模式和转录组数据,构建代谢途径基因和代谢物的共表达网络,计算代谢物与基因模块之间的相关系数。

结果显示,重楼皂苷 II 与棕色模块的相关系数为 0.84,聚类紧密;重楼皂苷 III 与绿松石模块(0.99)和品红色模块(0.74)相关性最高;重楼皂苷 VI、VII 和 H 与蓝色模块(0.89 - 0.96)和午夜蓝色模块(0.86 - 0.89)相关性最高,重楼皂苷 VII 还与宝蓝色模块(0.77)相关。这些结果表明,棕色、绿松石、品红色、蓝色、午夜蓝色和宝蓝色模块中的基因可能参与重楼皂苷的生物合成。从 6 个预测模块中鉴定出 40 个 CYPs 和 28 个 UGTs,这些基因在不同重楼属植物中的表达水平存在差异,暗示它们在重楼皂苷生物合成中可能发挥重要作用。
4. 重楼皂苷合成相关基因的系统发育分析和基因 - 代谢物相关性分析:根据转录组的基因注释,在重楼根茎中鉴定出 6 个 OSCs、120 个 CYPs 和 138 个 UGTs。通过系统发育分析预测候选的 OSC、CYP 和 UGT 基因,结果显示 PacBio 转录本 36785 和 40530 与 PpCAS 密切相关,39225、38091、37036 和 36669 与 PpOSC1 密切相关;在 120 个 CYPs 中,65 个可能是重楼属植物中的推定 CYPs,如 PacBio 转录本 47874 与 PpCYP94D108 密切相关等;在 UGTs 中,不同家族的基因存在差异,如 PacBio 转录本 48081 和 47736 与 PpUGT73C1 密切相关,46663 与 PpUGT73CE1 遗传关系最为接近。

通过分析重楼皂苷水平与相应基因表达模式的相关性,发现薯蓣皂苷元皂苷(重楼皂苷 VI、VII 和 H)与 DWF1、CAS 等基因呈强正相关,重楼皂苷 VI 和 H 还与 CPI1 和 C5 - SD 显著正相关,这些基因在法氏重楼中表达水平最高。重楼皂苷 I、II 和 III 与上述 4 个基因呈负相关,其中重楼皂苷 II 与 CYP51 呈显著正相关,在滇重楼中的表达水平高于法氏重楼和长柱重楼;重楼皂苷 III 与 C14 - R 和 SMT1 呈显著正相关,C14 - R 和 SMT1 在长柱重楼中的表达水平最高。此外,不同数量的 CYPs 和 UGTs 与不同重楼皂苷的水平相关。随机选择 18 个皂苷生物合成相关基因进行 RT - qPCR 分析,结果与 RNA - seq 数据的表达趋势一致。

研究结论与讨论


该研究对滇重楼、法氏重楼和长柱重楼的重楼皂苷水平进行了全面表征,发现不同重楼属植物根茎中特定重楼皂苷含量的差异可能导致其具有不同的药理作用。通过对这三种重楼属植物进行综合代谢组学和转录组学分析,成功鉴定出 17 个参与重楼皂苷生物合成的同源基因,包括 2 个 CASs、4 个 CYPs 和 11 个 UGTs 。这些

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号