基于ATFEM框架的土壤纹理分类:融合频率感知特征工程与三重深度学习架构的创新方法

《Scientific Reports》:Advanced deep learning framework for soil texture classification

【字体: 时间:2025年10月03日 来源:Scientific Reports 3.9

编辑推荐:

  本研究针对传统土壤纹理分类方法存在的高维冗余、噪声敏感和可解释性差等问题,开发了ATFEM(Advanced Triptych Feature Engineering and Modeling)框架。该研究创新性地提出F-HOG(Farthing Histogram of Oriented Gradients)特征描述符,结合Butterworth频域滤波和EWJFO(Enhanced Wombat-Jellyfish Feature Optimization)优化算法,构建了VGG-RTPNet、ResNet-DANet和Swin-FANet三重深度学习架构。实验结果表明,该框架在自建土壤纹理数据集上达到98.10%的准确率和94.80%的Kappa系数,显著优于现有先进方法,为精准农业和环境监测提供了可扩展的解决方案。

  
土壤作为农业生产的基础,其纹理特征直接影响着水分渗透、养分保持和作物生长。传统土壤纹理分类主要依赖实验室分析方法,如比重计法和移液管法,虽然精度较高但耗时费力,难以满足大规模土壤调查的需求。随着遥感技术和图像分析的发展,基于机器学习的土壤分类方法逐渐兴起,但仍面临特征冗余、噪声敏感和模型适应性差等挑战。特别是在复杂田间环境下,土壤图像常受到光照变化、阴影干扰和植被覆盖的影响,导致分类精度不稳定。
针对这些问题,N. Latha Reddy和M. P. Gopinath在《Scientific Reports》上发表了题为"Advanced deep learning framework for soil texture classification"的研究论文,提出了创新的ATFEM框架。该研究通过融合手工特征与深度学习表示,实现了土壤纹理的高精度分类,为精准农业和环境管理提供了可靠的技术支持。
研究团队采用多项关键技术方法:首先通过Butterworth频域滤波和Box-Cox变换进行图像预处理,有效去除噪声并增强纹理特征;接着开发了F-HOG特征描述符,结合Haralick特征和LBP(Local Binary Patterns)实现多尺度纹理表征;利用EWJFO优化算法进行特征选择;最后构建了包含VGG-RTPNet、ResNet-DANet和Swin-FANet的三重深度学习架构,并通过SHAP(Shapley Additive Explanations)等可解释性AI技术验证模型决策过程。实验基于包含4000张标记图像的自建土壤纹理数据集,涵盖五种纹理类别。
数据预处理
研究采用Butterworth低通滤波器在频域中对土壤图像进行预处理,有效抑制高频噪声同时保留边缘结构。通过计算图像在频域中的傅里叶变换,应用Butterworth滤波器函数H(x,y)=1/[1+(D(i,j)/D0)2n]进行滤波处理,其中D0为截止频率,n为滤波器阶数。随后使用Box-Cox变换对像素强度进行归一化,稳定方差并减少偏度。数据增强策略包括翻转、旋转和平移等操作,显著提升了模型的泛化能力。预处理阶段的视觉分析显示,高频成分得到有效抑制,光谱熵降低31.4%,纹理清晰度明显提升。
特征提取
研究提出了创新的F-HOG特征描述符,通过Butterworth频域滤波和统计频率排序,仅保留前F个最频繁的梯度区间,显著降低了特征维度。与传统HOG相比,F-HOG将特征维度从3780降至960,训练时间减少35-60%,同时准确率提升至92.84%。此外,研究还结合了Haralick特征和LBP特征,分别捕获宏观纹理统计特征和微观局部模式。通过EWJFO优化算法选择的φ-Pixels特征,进一步增强了颜色特征的判别能力。特征提取的消融研究表明,多特征融合策略显著提升了分类性能。
特征融合与选择
研究采用加权拼接策略对多源特征进行融合:F = [wFH·F?HOG, wH·?, wLBP·L?LBP, wφ·φ?]。EWJFO优化算法结合了Wombat优化算法的自适应探索和Jellyfish搜索优化器的快速收敛特性,通过适应度函数F(φ)=α·Accval(φ)+β·(1-|φ|/256)实现特征选择,在准确性和紧凑性之间取得最优平衡。
三重深度学习架构
ATFEM框架的核心是三重深度学习架构:VGG-RTPNet通过残差跳跃增强卷积块(RSACB)保留细粒度纹理特征;ResNet-DANet引入双注意力调制(DAM)机制,同时关注通道和空间显著性;Swin-FANet则通过频率感知位置编码(FAPE)将频谱先验注入Transformer自注意力机制。这种架构设计使得模型能够同时捕获局部纹理细节和全局上下文信息。
实验验证
在包含五种土壤纹理类别的数据集上,ATFEM框架实现了98.10%的分类准确率、89.60%的F1分数和94.80%的Kappa系数,显著优于GBDT-CNN(95.10%)、CatBoost-DNN(92.30%)和SVC-RF(89.00%)等基线方法。五折交叉验证结果显示模型具有稳定的性能,准确率标准差仅为±0.0022。可解释性分析通过SHAP和Grad-CAM等技术验证了模型决策的合理性,表明特征重要性分布与土壤学先验知识一致。
该研究的创新性主要体现在三个方面:首先,F-HOG特征描述符通过频域滤波和统计选择机制,有效解决了传统HOG特征的高维冗余问题;其次,三重深度学习架构的协同设计实现了多尺度特征的有效融合;最后,EWJFO优化算法为特征选择提供了自适应解决方案。这些技术突破使得ATFEM框架在保持高精度的同时,兼具良好的可解释性和计算效率。
研究的意义不仅在于提出了一个高效的土壤纹理分类框架,更重要的是为多模态特征融合和可解释深度学习提供了通用范式。该技术可广泛应用于精准农业中的土壤质量评估、环境监测中的土地利用分类以及地质勘探中的岩性识别等领域。未来研究方向包括扩展至多光谱数据、融入时序环境变量以及开发嵌入式实时处理系统,进一步提升技术在动态环境下的适应性和实用性。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号