
-
生物通官微
陪你抓住生命科技
跳动的脉搏
综述:农业食品领域以数据为中心的人工智能:系统性图谱研究
【字体: 大 中 小 】 时间:2025年08月30日 来源:Computers and Electronics in Agriculture 8.9
编辑推荐:
这篇综述系统梳理了数据为中心的人工智能(Data-Centric AI, DCAI)在农业食品领域(Agrifood Domain, AFD)的应用进展,聚焦数据质量提升、数据集构建和数据增强等关键技术,揭示了该范式在作物监测、病虫害识别等场景中的潜力与标准化挑战。
农业食品领域正逐步采用人工智能(AI)应对粮食生产、环境可持续性和资源效率等挑战。然而,数据质量、可用性和整合性仍是开发可靠AI系统的关键障碍。数据为中心的人工智能(DCAI)将焦点从单纯优化模型转向优先提升数据质量,从而推动稳健AI解决方案的发展。过去十年中,DCAI方法在作物监测、病虫害识别、土壤评估和产量优化等领域的应用显著增长,但数据集标准化不足和可重复性挑战仍是主要瓶颈。
传统AI以模型为中心,强调架构选择和超参数优化,而DCAI则通过数据工程提升系统性能。其核心策略包括:
训练数据开发:通过数据集创建、整合和增强(如生成对抗网络GANs1)提升数据多样性;
推理数据设计:构建针对性输入以评估模型能力;
数据维护:利用可视化、质量指标和可解释AI(xAI)持续优化数据。例如,GPT-3的性能飞跃主要依赖更大规模的高质量训练数据,而非架构创新。
AI在农业中覆盖从生产到废弃物管理的全链条,典型应用包括:
视觉任务:基于深度学习的植物幼苗检测(如Scharr等2020数据集)和果树果实识别;
精准农业:通过传感器数据优化灌溉和施肥,如无人机路径规划(Nanavati等2023);
环境监测:土壤含水量分析(Zhang等2022)和降水预测(Pham等2024)。
通过对31项核心文献的分析发现:
技术分布:数据质量方法占比最高(9篇),其次为数据集创建(8篇)和数据增强(7篇);
应用热点:植物与病虫害检测占主导(16篇),喷雾沉积识别和温室管理次之;
地域趋势:中国(9篇)和印度(4篇)研究活跃,但工业界参与度不足(仅3篇含企业合作)。
当前局限集中于数据异构性(如标注不一致)和模型泛化能力。未来需优先发展:
跨模态数据整合:融合图像、传感器和文本数据;
自动化工具链:减少人工参数调优(如Lad等2022的色彩归一化方法);
标准化评估框架:解决可重复性问题(Wang等2022的实例筛选实验)。
DCAI为农业食品领域提供了从数据底层驱动AI效能的新路径,尤其在视觉任务中表现突出。然而,实现大规模落地仍需突破数据壁垒和技术碎片化,这将是未来研究的关键靶点。
1 Generative Adversarial Networks,生成对抗网络
生物通微信公众号
知名企业招聘