编辑推荐:
为解决多元海洋化学数据强耦合、复杂机制影响导致的长期预测难题,研究人员开展基于数据驱动 Transformer 的多变量长期预测模型研究。结果表明模型在多数据集表现优异,MAE、RMSE 等显著改善,为提升水产养殖管理效率提供支撑。
水产养殖的可持续发展离不开对水质环境的精准把控。溶解氧(DO)、水温、盐度等水质因子不仅直接影响水生生物的生存与繁殖,还与饲料投放、水循环系统运行等养殖管理环节密切相关。然而,海洋环境中多元化学数据间存在强耦合关系,加之气候变化引发的海洋酸化、温度升高等复杂机制影响,使得长期精准预测水质参数面临巨大挑战。例如,全球河口和沿海地区频繁出现的低溶解氧现象,会导致养殖物种生长缓慢甚至窒息,而氮、磷等参数的变化则可能引发病原体激增或有害藻华,增加养殖病害风险。传统的预测模型要么依赖特定区域的物理化学过程,普适性不足;要么在处理长序列数据和多变量动态关联时表现欠佳,难以满足水产养殖长期管理的需求。
为突破上述瓶颈,国内研究团队针对多元海洋化学数据的长期预测问题展开深入研究。该团队在《Computers and Electronics in Agriculture》发表的研究成果,提出了一种数据驱动的 Transformer 多变量长期预测模型,旨在实现水产养殖环境中关键水质因子的多输入多输出长期预测。
研究人员主要采用了以下关键技术方法:首先,设计多变量相关性分解策略,通过最大信息系数(MIC)分析变量间线性与非线性依赖关系,构建定量关系矩阵,并结合多通道奇异谱分析(M-SSA)的轨迹矩阵,实现预测变量解耦和关键特征提取;其次,引入基于四元数的旋转注意力机制,通过空间旋转操作捕捉分解后的趋势和季节特征,增强模型对多周期特征空间中动态变化周期的学习能力;最后,开发比例 - 积分 - 微分(PID)预测补偿机制,通过模型内部的比例、积分和微分反馈网络适应海洋环境动态变化,降低长期预测中的累积误差。
结果与讨论
数据集与实验设计
研究选取六个真实海洋数据集(含公共数据集 FHLOO),针对未来 7 天的水质参数进行预测实验。实验对比了该模型与六种基准模型的性能,评估指标包括平均绝对误差(MAE)、均方根误差(RMSE)、克林 - 古普塔效率(KGE)和纳什 - 萨特克利夫效率(NSE)。
模型性能对比
在 FHLOO 数据集上,该模型表现出显著优势:MAE 较基准模型降低 51.8%,RMSE 减少 36.7%,KGE 和 NSE 分别提升 44.5% 和 59.7%。其他数据集的实验结果也显示,该模型在多变量长期预测中具有更高的准确性和更强的泛化能力,有效验证了其在复杂海洋环境中的适用性。
消融研究
通过对模型各组件(多变量分解策略、旋转注意力机制、PID 补偿机制)进行消融实验发现,每个组件均对模型性能有显著贡献。其中,旋转注意力机制在捕捉多周期特征方面作用突出,PID 补偿机制则显著降低了长期预测的累积误差,验证了模型设计的合理性和各模块的必要性。
结论与意义
该研究构建的 Transformer 多变量长期预测模型,通过多变量相关性分解、旋转注意力机制和 PID 补偿机制的协同作用,有效解决了多元海洋化学数据的强耦合性、多尺度波动和动态非线性变化带来的预测难题。模型实现了多输入多输出的长期精准预测,为水产养殖管理者提供了可靠的水质预测工具,有助于优化养殖管理策略、降低病害风险、提升经济效益,对推动海洋可持续养殖具有重要的实际应用价值。未来研究可进一步拓展模型在不同养殖场景中的适应性,结合更丰富的环境变量(如气象数据、生物指标等),进一步提升预测的全面性和精度。