
-
生物通官微
陪你抓住生命科技
跳动的脉搏
在精准农业中,针对高维和大规模数据集优化管理区域划分技术
《Precision Agriculture》:Optimizing management zone delineation technique for high-dimensional and large-volume datasets in precision agriculture
【字体: 大 中 小 】 时间:2025年10月25日 来源:Precision Agriculture 6.6
编辑推荐:
管理区划(MZ)划分研究整合变量选择方法(t-SNE、PCA等)和聚类算法(FCM、K-means等),通过高维土壤数据挖掘提升精准农业效率。
管理区(Management Zone,MZ)的划分对于精准的土壤和作物管理至关重要,它有助于将田地划分为具有相似特性的子区域。本研究探讨了如何整合变量选择方法和聚类算法,以利用高维和大规模数据集提高MZ划分的准确性。
评估了四种变量选择方法(全属性选择[All]、主成分分析[PCA]、MULTISPATI-PCA[SPCA]和t分布随机邻域嵌入[t-SNE])以及五种聚类算法(K均值[K-means]、模糊C均值[FCM]、BIRCH、小批量K均值[MBK]和空间受限层次聚类)。通过在线可见光和近红外光谱平台收集了包含八项土壤属性(pH值、有机碳、镁、磷、钾、钙、钠和水分含量)的数据,这些数据来自两个商业田地,共获取了数千个采样点。使用Silhouette指数和Davies-Bould指数评估了三个、四个和五个MZ的分区结果,并进一步对不同区域内的土壤属性进行了统计分析。
根据第一级值(First-Level Value,FLV)的频率确定了最优的MZ数量:第一块田地划分为四个MZ(频率分别为8、14和8),第二块田地划分为三个MZ(频率分别为19、10和1)。进一步验证表明,t-SNE与FCM或K均值结合使用对第一块田地最为有效,而t-SNE与MBK或K均值结合使用对第二块田地效果最佳。
将先进的变量选择和聚类技术相结合,特别是t-SNE与FCM、MBK或K均值结合使用,显著提高了大规模土壤数据集中的MZ划分精度。这些发现为精准农业应用奠定了坚实的基础。
管理区(Management Zone,MZ)的划分对于精准的土壤和作物管理至关重要,它有助于将田地划分为具有相似特性的子区域。本研究探讨了如何整合变量选择方法和聚类算法,以利用高维和大规模数据集提高MZ划分的准确性。
评估了四种变量选择方法(全属性选择[All]、主成分分析[PCA]、MULTISPATI-PCA[SPCA]和t分布随机邻域嵌入[t-SNE])以及五种聚类算法(K均值[K-means]、模糊C均值[FCM]、BIRCH、小批量K均值[MBK]和空间受限层次聚类)。通过在线可见光和近红外光谱平台收集了包含八项土壤属性(pH值、有机碳、镁、磷、钾、钙、钠和水分含量)的数据,这些数据来自两个商业田地,共获取了数千个采样点。使用Silhouette指数和Davies-Bould指数评估了三个、四个和五个MZ的分区结果,并进一步对不同区域内的土壤属性进行了统计分析。
根据第一级值(FLV)的频率确定了最优的MZ数量:第一块田地划分为四个MZ(频率分别为8、14和8),第二块田地划分为三个MZ(频率分别为19、10和1)。进一步验证表明,t-SNE与FCM或K均值结合使用对第一块田地最为有效,而t-SNE与MBK或K均值结合使用对第二块田地效果最佳。
将先进的变量选择和聚类技术相结合,特别是t-SNE与FCM、MBK或K均值结合使用,显著提高了大规模土壤数据集中的MZ划分精度。这些发现为精准农业应用奠定了坚实的基础。