编辑推荐:
为解决红松 SSR 标记匮乏及生产群体优化问题,相关研究人员开展基于 RAD-Seq 技术开发 SSR 标记及构建生产群体的研究。结果开发出标记,构建了合理生产群体。该研究为红松遗传改良等提供支撑,值得一读。
在我国东北的山林中,红松(Pinus koraiensis)可是个 “明星树种”。它不仅身姿挺拔,是长白山及周边山脉的重要组成部分,而且用途广泛,凭借优质的木材在经济林中占据重要地位。早在 20 世纪 80 年代,我国就开启了红松遗传改良的大计划,建立了众多种子园,满心期待培育出更优质的红松品种。
然而,理想很丰满,现实却很骨感。那时选优树(指在某一或某些性状上明显优于周围同类树木的单株 )主要看树的身高(高度)和身材(胸径),却忽视了像球果产量和质量这些经济性状。而且,由于当时技术有限,选优树组成生产群体时,根本没考虑它们之间的 “亲戚关系”(遗传关系),结果导致生产群体的球果产量低得可怜。想通过子代测试来升级生产群体吧,红松偏偏又是个 “慢性子”,人工种植的红松差不多要 20 年才开始结球果,再加上子代测试群体密度大,获取高质量的嫁接接穗也困难重重,短期内升级生产群体基本没希望。所以,怎么改良生产群体,提升红松的产量,成了亟待解决的大难题。
为了攻克这个难题,研究人员一直在寻找新的方法。分子标记技术给他们带来了希望,其中简单序列重复(SSR)标记因其多态性高、DNA 用量少、共显性遗传、特异性强等优点,在林业研究中备受青睐。可红松的 SSR 标记大多是从近缘物种筛选,或者基于转录组分析开发的。这些方法得到的标记,要么因为物种遗传背景差异,要么由于转录组序列保守,导致多态性不高,影响了在红松遗传多样性评估和种质鉴定中的效果。
好在科技不断进步,新一代测序技术诞生了,能产生海量序列数据,为开发新标记提供了可能。基于限制位点相关 DNA 测序(RAD-Seq)技术开发 SSR 标记,效率高、成本低,还能涵盖全基因组遗传信息。不过,之前这项技术在针叶树,尤其是红松上还没人研究过。
在这样的背景下,来自相关单位的研究人员憋足了劲,决心啃下这块 “硬骨头”。他们的研究成果发表在了《BMC Plant Biology》期刊上,论文题目是《Development of SSR markers based on RAD-Seq and their application in analyzing genetic diversity and constructing production populations of Pinus koraiensis》 。这项研究意义重大,不仅成功开发出适用于红松的 SSR 标记,还构建了优质的生产群体,为红松遗传改良、种质资源保护和可持续发展打下了坚实基础,同时也给其他树种 SSR 标记的开发应用提供了宝贵经验。
研究人员为了开展这项研究,用到了几个关键技术方法。首先是 RAD-Seq 技术,用它来获取红松的基因组数据。然后借助 TBtools-II 软件进行 SSR 挖掘,按照一定标准筛选出合适的 SSR 位点。还有引物设计和筛选技术,利用 Primer 6.0 软件设计引物,再通过 e-PCR 验证引物特异性,经过多轮筛选得到可用的引物。最后,运用多种数据分析软件,像 PowerMarker V3.25、GenAIEX 6.51b2、MEGA11 等,对遗传数据进行全面分析。
下面来看看研究都有哪些重要发现。
1. SSR 的数量和分布情况
研究人员在红松简化基因组里发现了 80,539 个 SSR 位点,出现频率是 1.379%。这些 SSR 位点里,二核苷酸和三核苷酸类型占了大头,加起来有 93.838%,六核苷酸就比较少,只有 304 个。重复次数为 6 的 SSR 位点数量最多,随着重复次数增加,SSR 数量逐渐减少,但 15 次重复的是个例外。片段长度方面,12bp 的 SSR 位点数量最多,之后随着片段变大,数量又减少。在碱基类型上,TA/AT 出现的次数最多,前 5 种碱基类型加起来占了所有碱基类型的 30%。按照标准筛选出 1933 个 SSR 位点后,成功设计出 1162 对引物,不过很多引物位置只是部分覆盖 SSR 序列。经过 e-PCR 筛选,最终保留了 79 对特异性引物。
2. 引物的合成和选择结果
合成这 79 对特异性引物后,研究人员拿 100 个红松无性系的 DNA 混合样本做模板进行扩增测试,发现只有 27 对引物能扩增出目标片段。接着从这 27 对引物里随机选 10 个克隆检测多态性,结果只有 9 对引物表现出多态性。这 9 对引物里,二核苷酸、三核苷酸、四核苷酸的都有,引物长度在 19 - 22bp 之间,还在正向引物 5’端加上了荧光标记。
3. 优树群体的遗传分析情况
研究人员用这 9 个 SSR 标记对优树群体进行遗传分析。结果显示,平均等位基因数(NA)是 9.333,平均有效等位基因数(NE)是 4.032,平均多态信息含量(PIC)是 0.530。像 Pk2-17 等 5 个标记多态性比较高,Pk4-246 则没有多态性。从其他遗传参数来看,优树群体遗传多样性比较丰富,不过存在轻微的过度杂交倾向。而且,经过 Bonferroni 校正后,有 6 个多态性 SSR 位点显著偏离哈迪 - 温伯格平衡(Hardy?Weinberg equilibrium,是指在理想状态下,种群的基因频率和基因型频率在代代相传中保持稳定不变 )。
4. 亚群体的遗传分化情况
为了搞清楚优树群体在时空维度上的遗传特征,研究人员按照海拔、距离、年龄把优树群体分成不同亚群体进行分析。结果发现,遗传变异主要来自亚群体内部。不同海拔、距离、年龄亚群体之间的遗传分化都很小,比如不同海拔亚群体间平均FST 是 0.009,不同距离亚群体间是 0.008,不同年龄亚群体间也是 0.008。主成分分析(PCA)也表明,不同维度划分的群体没有明显聚类,遗传多样性水平相近。只有海拔超过 835m 的亚群体,F值大于 0,存在轻微杂合缺失。
5. 生产群体的构建情况
研究人员观察了 116 棵天然红松优树 2017 - 2024 年的球果产量,发现不同优树之间球果产量差异显著。他们选了 39 棵球果产量超过平均值的优树构建生产群体,这个群体的平均球果产量比优树群体高 82.46%。对比模拟退火算法和随机抽样法构建生产群体的效率,发现模拟退火算法在等位基因数、基因熵和基因多样性方面都更有优势。综合考虑,确定最优生产群体大小是 20。和优树群体相比,生产群体虽然等位基因数少了,但有效等位基因数相近,遗传多样性参数也相近,而且F值更接近 0,交配系统更合理,平均球果产量比优树群体高 79.6%,主成分分析显示两个群体分布范围相似,说明生产群体构建过程没有偏离优树群体。
从研究结论和讨论来看,这次研究成果满满。研究人员用 RAD-Seq 技术开发红松 SSR 标记,比之前用参考基因组或转录组序列开发的方法更高效、更准确。开发的 SSR 标记多态性比之前的 EST-SSR 标记更高,不过和其他物种比,多态信息含量略低,这可能和研究材料来自单一群体有关。优树群体遗传多样性丰富,不同维度划分的亚群体遗传分化小,这和红松寿命长、花粉传播能力强有关。
构建生产群体时,研究人员基于基因多样性原则,筛选出高产优树,确定了合适的群体大小。和之前红松核心种质构建研究不同,这次研究用遗传距离和种质间多样性作为构建原则。通过和优树群体对比,证明构建的生产群体遗传背景和优树群体相似,球果产量还更高。
不过,研究也有一些小遗憾。研究对象只是一个天然优树群体,没办法完全代表红松所有自然资源的遗传状况。而且 RAD-Seq 技术也有局限,很多 SSR 两端序列长度不够,不利于引物设计。但这并不影响这项研究的重要价值,它为红松遗传改良和种质资源保护打开了新的大门,相信未来随着研究的深入,红松的 “成长之路” 会越走越顺,为我们的生态环境和经济发展带来更多惊喜。