
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于Transformer架构与近红外光谱的小样本学习在牛油果成熟度检测中的创新应用
【字体: 大 中 小 】 时间:2025年09月21日 来源:Smart Agricultural Technology 5.7
编辑推荐:
本研究针对传统牛油果采后成熟度检测方法主观性强、效率低的问题,开发了一种基于Transformer架构的Few-Shot Learning(FSL)模型,结合便携式NIR光谱技术,实现了仅需2%-20%标注数据即可达到80%以上分类准确率的突破。该研究为资源受限的农业环境提供了可定制化的智能分类解决方案,显著降低对大规模标注数据的依赖,对推动精准农业发展具有重要意义。
在农产品采后管理领域,牛油果成熟度的精准快速检测始终是一项重大挑战。传统依赖人工视觉检测的方法不仅受主观判断影响显著,且缺乏一致性,导致供应链效率低下和浪费加剧。虽然近红外(NIR)光谱技术已成为无损检测水果内部生化指标的关键工具,但现有智能分类系统在资源有限的农业环境中应用仍受限,主要原因包括机器学习模型复杂度高,以及缺乏大量标注数据支持模型更新。
针对这一痛点,研究人员在《Smart Agricultural Technology》发表了一项创新研究,探讨如何通过小样本学习(Few-Shot Learning, FSL)结合Transformer架构与便携式NIR光谱技术,实现牛油果成熟度的高效分类。该研究不仅开发了集成AS7265x传感器的便携式NIR扫描设备,还构建了基于注意力机制的轻量化分类模型,在极低标注数据条件下仍保持优异性能。
研究采用了两大实验模块:一是通过模拟与实测对比HTTP与MQTT通信协议在WIFI、NB-IoT和LoRa三种网络环境下传输NIR光谱数据的性能;二是利用真实采集的牛油果NIR光谱数据,基于Transformer模型进行小样本学习分类实验。关键技术方法包括:使用便携式NIR扫描仪(AS7265x传感器)采集451个牛油果样本的18波段光谱数据;采用Multiplicative Scatter Correction(MSC)进行光谱预处理;通过episodic训练策略构建Transformer-based FSL模型;使用5折分层交叉验证评估模型性能,并以F1-score、ROC AUC和混淆矩阵作为主要评价指标。
研究结果方面,在通信协议实验中发现:MQTT在受限网络(NB-IoT和LoRa)中 consistently 表现优于HTTP,尤其在传输组光谱(4560字节)和全光谱(45600字节)数据时延迟更低、吞吐量更高。例如在LoRa网络中,MQTT传输组光谱数据时吞吐量稳定在4583-4596字节,而HTTP波动较大(5536-5816字节),表明MQTT更适用于资源受限的农业物联网环境。
在分类性能方面,小样本学习模型展现出惊人潜力:仅使用2%标注数据(1-shot)时,模型对Aged类别牛油果的分类AUC已达0.90以上;当样本比例提升至20%时,整体宏F1-score超过0.80,其中Aged类别接近完美分类。通过混淆矩阵和ROC曲线分析发现,模型在Raw和Ripe类别间存在一定混淆,这与其光谱特征重叠的生物学特性一致,但通过增加支持样本量可显著改善分类边界。
值得注意的是,模型对特定波长表现出高度敏感性:在730-810 nm区间(与叶绿素降解和水分流失相关)以及860-890 nm区间(与脂质和碳水化合物转化相关)的特征响应最为显著,其中890 nm附近(Spectrum16)的峰值成为区分成熟度的关键指标。这一发现与牛油果成熟过程中生化变化规律高度吻合,证明了NIR光谱技术的生物学合理性。
研究结论表明,集成MQTT通信协议与Transformer-based FSL的便携式NIR系统,能够为农业现场提供低延迟、高精度的成熟度检测方案。该方法仅需少量用户标注即可实现模型定制化,极大降低了传统方法对大规模标注数据和云计算资源的依赖。讨论部分进一步指出,该技术的推广将有助于解决偏远地区农业监测的痛点,未来可通过持续学习机制实现模型动态更新,并拓展到多作物、多模态传感应用场景,为智慧农业发展提供关键技术支撑。
生物通微信公众号
知名企业招聘