基于注意力增强ShuffleNet和可解释人工智能的平菇栽培实时监控系统

《Smart Agricultural Technology》:Real-Time Monitoring of Oyster Mushroom Cultivation Using CCTV and Attention-Enhanced ShuffleNet-Based Explainable AI Techniques

【字体: 时间:2025年10月27日 来源:Smart Agricultural Technology 5.7

编辑推荐:

  本研究针对平菇成熟度人工检测效率低、主观性强的问题,开发了一种集成CCTV监控和轻量级深度学习的技术框架。通过评估多种架构,发现结合自注意力机制的ShuffleNetV2模型在20,000张标注图像上达到99.70%准确率(10折交叉验证),参数仅130万。研究创新性地引入Grad-CAM、LIME等XAI技术提升模型透明度,并实现实时分类(2.77 FPS),为精准农业提供了高效可解释的解决方案。

  
在当今追求可持续农业的背景下,平菇(Pleurotus ostreatus)因其高营养价值、短生长周期和低成本优势成为全球广泛栽培的食用菌。然而,其快速生长特性(通常2-3周即成熟)给采收时机判断带来巨大挑战:过早采收影响产量品质,延迟采收则导致商品价值下降和采后损失增加。传统依赖人工目视检测的方法存在主观性强、劳动强度大、一致性差等痛点,尤其在大规模种植场景下难以保证效率。这一瓶颈促使研究者将目光投向计算机视觉与人工智能技术,试图通过自动化方案实现精准监控。
为破解这一难题,来自孟加拉国东西大学的研究团队在《Smart Agricultural Technology》发表了一项创新研究,提出了一种融合轻量级深度学习与可解释人工智能(XAI)的实时监控框架。该研究通过系统比较多种先进架构,最终构建出兼具高精度、高效率与高透明度的平菇成熟度分类系统,为智慧农业提供了可落地的技术方案。
本研究的技术路径主要包含四个关键环节:首先采用包含20,000张CCTV图像的标注数据集(Duman等人收集),通过数据增强解决类别不平衡问题;其次系统比较EfficientNet、DenseNet、VGG、Vision Transformer等架构;进而对优选模型ShuffleNetV2注入自注意力机制增强特征提取能力;最后集成Grad-CAM、Grad-CAM++、EigenCAM和LIME等XAI技术实现决策可视化,并基于OpenCV搭建实时监控流水线。

3.1. 数据集描述

研究采用土耳其梅尔辛农场采集的平菇图像数据集,涵盖两个完整栽培周期(2022年12月至2023年4月),包含16,000余张在昼夜不同光照条件下拍摄的标注图像。数据集特别设置了"未成熟"(5,124张)和"成熟"(3,158张)两类标签,并配套提供温度、湿度等传感器数据。针对原始数据存在的类别不平衡(未成熟样本占比62%)、环境噪声和分辨率差异等问题,研究团队通过过采样和加权损失策略进行优化。

3.2. 数据预处理

所有图像统一缩放至128×128像素分辨率,相比常见的224×224规格,这一选择既避免了小尺寸原图(最小34×38像素)放大后的像素化问题,又提升了计算效率。通过水平翻转、随机旋转(20°)及亮度/饱和度/对比度调整(20%)等数据增强手段,将每类样本扩充至10,000张,有效提升了模型泛化能力。

3.3. 基线模型比较

研究团队系统评估了VGG16/19、MobileNetV2、EfficientNetB0/B3、DenseNet121/201、ResNet50及Vision Transformer(ViT-B/16)等主流架构。结果显示,传统VGG模型参数量超1.34亿,而轻量型ShuffleNetV2仅需约130万参数,在保持竞争力的准确率同时大幅降低计算开销。

3.4. 提出的ShuffleNetV2注意力架构

核心创新点是在ShuffleNetV2骨干网络末端嵌入非局部注意力块(Non-Local Attention Block),使模型能够捕捉长程空间依赖关系。该架构通过点分组卷积、通道分割与通道混洗操作实现高效特征提取,最终通过全局平均池化(GAP)和全连接层输出分类结果。数学表达上,前向传播过程可表述为:特征提取F0ShuffleNetV2(x),注意力增强FaAttention(F0),全局池化Fp=GAP(Fa),最终通过权重矩阵W和偏置b实现分类决策。

4.1. 模型参数比较

参数量分析显示,ShuffleNetV2(130万)仅为VGG19(1.39亿)的0.9%,模型权重文件大小仅5MB,显著优于EfficientNetB3(41.4MB)和ResNet50(90MB)等模型,体现出极佳的边缘部署优势。

4.2. 模型评估结果

在增强数据集上的10折交叉验证中,ShuffleNetV2达到99.70%准确率,超越EfficientNetB3(99.45%)和DenseNet201(99.05%)。统计检验显示其性能提升具有显著性(p<0.000001),95%置信区间为[0.8660,0.8940]。混淆矩阵进一步证实该模型在两类样本上均保持低误判率。

4.3. 可解释性分析

通过Grad-CAM等热力图可视化发现,模型注意力区域与生物学特征高度吻合:成熟平菇聚焦于菌盖中央区域,未成熟样本则关注顶部纹理。定量评估中,Grad-CAM++获得的平均交并比(IoU)达0.339,表明解释结果与人工标注区域高度重叠。

4.4. 实时部署验证

集成OpenCV的实时系统处理速度达2.77帧/秒,单帧延迟48毫秒。通过跳帧处理(每5帧处理1帧)平衡计算负载,成功实现带Grad-CAM热力图叠加的实时分类演示。

5.1. 与现有研究对比

相较于传统方法(如OMC-YOLO的85.19%准确率)和参数密集型模型(如VGG),本研究在保持99.70%高精度的同时,将模型压缩至适合边缘设备部署的轻量级规模,实现了精度与效率的突破性平衡。

5.2. 局限性与未来方向

当前研究仍受限于图像分辨率,未来需探索高分辨率数据下的特征保持技术。实时视频处理中的动态适应性也有待提升,计划通过时序平滑和自适应学习进一步优化。此外,数据增强过程中的数据泄漏风险需通过更严格的分割策略规避。
这项研究通过创新性地将注意力机制与轻量级网络结合,并引入XAI技术增强可信度,成功构建了兼具高精度、高效率和可解释性的平菇成熟度监测系统。其5MB的模型大小和99.70%的分类准确率表明,该技术特别适合在资源受限的农业环境中部署应用,为智慧农业的智能化升级提供了重要技术支撑。未来通过进一步优化实时处理能力与跨环境适应性,这一框架有望扩展至其他农作物监测场景,推动精准农业的可持续发展。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号