编辑推荐:
为解决可可产量低的问题,研究人员开展了 “可可花性状受花位置与基因型互作影响” 的研究。对 CCN51 和 SCA6 两种基因型可可树研究发现,花位置和基因型影响花形态和数量,且可用机器学习预测基因型,这为可可育种和栽培提供了新思路。
可可,这种在全球经济和巧克力产业中占据重要地位的作物,其种植现状却令人担忧。在加纳、象牙海岸等主要种植国家,可可的种植多为低投入、低产出模式。这背后的关键原因之一,便是人们对可可生殖生物学的了解还不够深入。可可的开花过程极为复杂,从营养生长到生殖成熟的转变过程中,开花性状受多种因素影响,像开花时间、柱头可授期、果实形成、授粉成功率以及种子发育等,这些因素都与可可的产量息息相关。而且,虽然可可树能开出大量花朵,但真正成功授粉并结果的却寥寥无几。因此,深入探究影响可可花发育和生殖成功的因素迫在眉睫。
美国农业部农业研究服务局(USDA - ARS)的研究人员 Seunghyun Lim、Insuck Baek 等人开展了一项关于可可花性状的研究。该研究成果发表在《Heliyon》上。研究人员在可控的温室条件下,以 CCN51 和 SCA6 这两种可可基因型为研究对象,深入探究了垂直花位置以及相关环境和生理梯度对可可花性状的影响。研究发现,基因型和垂直位置对可可花的大小、形状和数量都有显著影响。例如,CCN51 的花明显比 SCA6 的花大,平均面积分别为18.63mm2和14.88mm2。此外,利用机器学习技术,尤其是支持向量机(SVM),研究人员能够基于花的测量数据高精度地预测基因型,受试者工作特征曲线下面积(AUC)达到 0.87。这一研究成果意义重大,它不仅加深了人们对可可生殖生物学的理解,还为可可的育种和栽培策略提供了宝贵的参考,有望推动可可产业朝着高产、可持续的方向发展。
在研究过程中,研究人员主要运用了以下几种关键技术方法:首先是温室实验,对 CCN51 和 SCA6 两种基因型的可可树进行栽培和观测;其次是图像分析,利用 SmartGrain 软件对特定发育阶段的可可花进行形态特征测量;然后是统计分析,包括 t 检验、相关性分析、主成分分析(PCA)和聚类分析等;最后是运用多种机器学习算法,如 SVM、决策树、随机森林等进行基因型预测和分析。
下面来详细介绍研究结果:
- 可可树性状之间的相关性:研究人员对 CCN51 和 SCA6 两种基因型可可树的花性状进行相关性分析。在 CCN51 中,发现垂直高度与 58 - 59 发育阶段的花数量呈中度负相关,与该阶段花的大小和形状属性(面积、周长、宽度)也呈负相关,但与长度 - 宽度比(LWR)呈正相关。在 SCA6 中,垂直高度与花大小也呈负相关,形状相关性状与垂直高度有不同关联,不过花数量与垂直高度无显著相关性。综合两种基因型数据,多数花性状之间存在强相互关系,但早期阶段花数量与后期花形态性状及垂直高度、58 - 59 阶段 LWR 与花数量之间无明显相关性。
- CCN51 和 SCA6 的表型性状对比:对比 CCN51 和 SCA6 基因型,CCN51 在 58 - 59 发育阶段的花尺寸(宽度、长度、周长和面积)更大,SCA6 的花更圆。CCN51 在 58 - 59 阶段的花数量更多,每个花垫上的花也更多,开放花数量、LWR 以及 IS 和 CG 之间的距离等性状值更高,而两种基因型的花垂直分布差异不显著。
- 主成分分析和层次聚类分析:通过主成分分析(PCA),前两个主成分解释了总方差的 61%,聚焦花大小和形状相关性状的 PCA 显示前两个主成分能解释 96% 的方差。PCA 双标图展示了两种基因型基于 12 个表型性状的分布,花大小相关性状、花数量相关性状分别聚类,形状相关性状分布较分散,LWR 与垂直高度聚类紧密。层次聚类分析也支持了这些结果。
- 机器学习分析:对 8 种分类模型进行受试者工作特征曲线(ROC)分析,SVM 表现最佳,AUC 为 0.87,逻辑回归和朴素贝叶斯次之,决策树表现最差。不同模型对各性状的权重不同,SVM - RBF 模型在训练集上 AUC 达到 0.90,但对两种基因型的分类准确率存在差异,SCA6 分类准确率高,CCN51 较低。通过多种可视化工具,揭示了花特征与基因型预测之间的复杂关系。
研究结论和讨论部分指出,该研究部分证实了假设,即垂直花位置相关的环境和生理梯度与基因型变异共同影响可可花的形态和数量。垂直位置影响花形态,可能是通过影响植物激素分布实现的。不同基因型在花数量调节上存在差异,CCN51 可能通过调整花分布适应垂直光梯度,而 SCA6 则无此调节机制。机器学习在可可基因型预测方面表现出色,能有效捕捉数据中的模式,但不同算法对特征的权重不同。SVM - RBF 模型虽然在训练集上表现良好,但对不同基因型分类准确率的差异提示可能存在过拟合或基因型表型变异差异的问题。
这项研究强调了垂直花位置、花形态和基因型之间的复杂关系,突出了优化树冠管理和光分布对提高可可产量的重要性。机器学习在可可育种和选择中的成功应用,为加速可可育种进程提供了新途径。未来,还需进一步研究可可花性状差异的分子机制,开展田间研究验证温室结果,探索利用砧木繁殖稳定或改良可可花性状的方法,以应对气候变化挑战,推动可可产业可持续发展。