
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于多尺度特征融合的深度神经网络FruitsMultiNet:移动端水果智能识别新方法
【字体: 大 中 小 】 时间:2025年06月13日 来源:Journal of Agriculture and Food Research 4.8
编辑推荐:
为解决水果自动分类难题,研究人员开发了基于MobileNet和VGG16融合的FruitsMultiNet框架,通过多尺度特征融合和迁移学习(TL)技术,在包含8种孟加拉本土水果的3240张图像数据集上实现99.84%的分类准确率,其移动端集成方案为农业供应链智能化提供了新范式。
在智能供应链快速发展的背景下,水果生产加工环节的自动化需求日益增长。然而,传统人工分类方法存在效率低、误差率高的问题,尤其对于形态多样的热带水果,如孟加拉地区特有的木苹果、罗望子等,其生命周期中颜色、纹理的显著变化更增加了分类难度。现有AI模型多基于西方常见水果数据集开发,对本土品种的识别性能有限。针对这一技术空白,来自孟加拉商业与技术大学、东南大学等机构的研究团队在《Journal of Agriculture and Food Research》发表研究,提出创新性的FruitsMultiNet框架。
研究团队采用迁移学习(TL)策略,融合轻量级MobileNet和高精度VGG16的优势,构建多尺度特征提取体系。关键技术包括:使用Kaggle公开的"Eight Types of Fruits"数据集(含3240张8类孟加拉水果图像);应用旋转、剪切等数据增强技术将训练集扩增至7840张;通过全局平均池化(GAP)和特征拼接整合双网络输出;采用互信息(MI)理论进行超参数优化;最终开发基于Flutter的移动应用实现实时分类。
研究结果显示:在模型性能方面,单独测试的MobileNet和VGG16分别达到99.53%和99.06%准确率,而融合后的FruitsMultiNet将性能提升至99.84%,显著优于对比的NasNetMobile(97.34%)、InceptionV3(97.65%)等模型。混淆矩阵分析表明,仅1例木苹果被误判为罗望子,归因于二者相似的纹理特征。训练过程显示,模型在第14个epoch即达到98%验证准确率,通过双重Dropout层有效抑制过拟合。移动端集成测试中,量化后的TensorFlow Lite模型在低配设备上实现300ms内完成推理,且支持离线运行。
与现有技术对比,该研究具有三大突破:首次针对孟加拉本土水果建立专用分类体系;创新性地结合MobileNet的移动计算优势与VGG16的深层特征提取能力;开发出首个支持8种热带水果识别的离线移动应用。相较于Shankar等采用DenseNet169的99.67%准确率,本方案在更复杂的数据分布下仍保持领先。局限性在于模型解释性不足,未来计划引入Grad-CAM可视化技术。
这项研究为农业智能化提供了重要技术支撑,其移动端解决方案特别适合资源受限地区。通过准确识别水果品种并附带营养信息,既优化了供应链效率,又促进了公众健康意识。研究团队指出,扩展病害检测功能和引入注意力机制(AM)将是下一步重点,这将进一步推动精准农业的发展。
生物通微信公众号
知名企业招聘