编辑推荐:
随着微藻衍生产品市场的增长,螺旋藻(Spirulina platensis)中 C - 藻蓝蛋白(CPC)的需求日益增加。传统的提取和定量方法存在诸多弊端,研究人员开展了基于机器学习和深度学习的 CPC 浓度预测研究。结果显示,混合堆叠集成模型表现优异,为 CPC 分析提供了新方向。
在微藻衍生产品的广阔市场中,螺旋藻凭借其合成 C - 藻蓝蛋白(CPC)的独特能力,成为了备受瞩目的焦点。CPC 不仅具有多种生物活性,在抗炎、抗氧化和抗癌等方面发挥着重要作用,而且在食品、药品和化妆品等领域有着广泛的应用前景。据市场分析,全球微藻衍生产品市场预计在 2017 - 2026 年间以 5.8% 的年增长率增长,到 2030 年,CPC 的市场需求有望达到 4.098 亿美元。然而,传统的 CPC 提取和定量方法却如同重重枷锁,阻碍着相关产业的高效发展。这些方法不仅耗时费力,还需要使用有毒溶剂,对环境造成较大危害,并且无法满足快速、准确检测的需求。因此,开发一种高效、无损的 CPC 浓度预测方法迫在眉睫。
在这样的背景下,来自国外的研究人员勇挑重担,开展了一项极具创新性的研究。他们致力于探索基于机器学习和深度学习的方法,以实现对螺旋藻中 CPC 浓度的精准预测。研究成果发表在《Ecological Informatics》上,为该领域带来了新的曙光。
研究人员运用了多种关键技术方法。在数据采集方面,他们精心培养螺旋藻(Spirulina platensis)NIES - 39,通过紫外线 - 可见分光光度计(UV - vis spectrophotometer)精确测定其生长和 CPC 浓度。同时,使用智能手机和数字相机,在不同光照条件下采集了大量的生物质和 CPC 图像数据。在模型构建上,选择了支持向量机(SVM)、极端梯度提升(XGBoost)和卷积神经网络(CNN)等模型,并构建了混合堆叠集成模型。其中,CNN 负责自动提取图像特征,SVM 和 XGBoost 作为基础模型,结合多种元回归模型进行最终预测。
下面让我们详细了解一下研究结果。
- 输入图像和参数对 CPC 浓度预测的影响:研究人员对螺旋藻进行培养,发现改良 BG - 11 培养基添加 NaHCO3和 NaNO3后,螺旋藻生长和 CPC 浓度发生显著变化。在培养过程中,随着时间推移,螺旋藻生物量逐渐增加,CPC 浓度先升后降,这与氮源的消耗密切相关。同时,研究表明,螺旋藻生物质、CPC 数据集以及 “Abs” 和 “Day” 等参数对 CPC 浓度的积累和预测有着重要影响。
- 对 SVM 模型性能的影响:对于生物质数据集,SVM 模型在 2V - Input(添加 “Day” 作为特征)时表现更优,HSL 颜色空间的数据集精度最高。而对于 CPC 数据集,1V - Input(仅使用颜色特征)就能达到较高精度,1V - RGB 表现最佳。此外,数字相机在覆盖条件下的配置比智能手机更准确。
- 对 XGBoost 模型性能的影响:XGBoost 模型在使用数字相机拍摄的生物质图像时,1V - Input、2V - Input 和 3V - Input 的精度相近。但使用智能手机拍摄的图像时,2V - Input 添加 “Day” 特征可提高精度。对于 CPC 数据集,所有输入配置的精度趋势相同,颜色特征足以进行准确预测,数字相机在覆盖条件下的图像精度最高。
- SVM、XGBoost 和 CNN 的性能比较:综合比较三种模型,XGBoost 在大多数配置下表现优于 SVM。CNN 在 CPC 数据集上表现较好,但在智能手机光照干扰条件下精度略有下降。在生物质数据集的光照干扰条件下,CNN 的精度高于 XGBoost 和 SVM。同时,通过多种评估指标分析发现,所有模型对 CPC 输入图像的预测效果更好。
- 混合堆叠集成技术组合所有模型的性能:混合堆叠集成模型中,以 meta - XGBoost 表现最为出色,其具有较低的标准差、较窄的 95% 置信区间和较高的预测稳定性。该模型在所有配置下均优于基础模型 SVM 和 XGBoost,有效提高了预测精度和泛化能力。
研究结论和讨论部分指出,XGBoost 在所有配置下均优于 SVM,其对噪声和变异性的抵抗能力更强。CNN 在自动特征提取方面具有优势,且训练和验证 R2曲线表现良好,表明模型开发稳定。混合堆叠集成模型,尤其是 meta - XGBoost,在所有配置下均表现优异,显著优于单个模型。这一研究成果意义重大,它不仅克服了传统方法的缺陷,为螺旋藻中 CPC 浓度的预测提供了更高效、准确的方法,而且为微藻相关产业的发展提供了有力的技术支持,推动了该领域向更加智能化、高效化的方向迈进。同时,研究也为其他类似的生物活性物质定量分析提供了借鉴,有望在生命科学和健康医学领域引发更多的创新研究。