综述:大数据分析如何加强大规模食品强化和生物强化决策:范围综述

【字体: 时间:2025年09月11日 来源:Annals of the New York Academy of Sciences 4.8

编辑推荐:

  本综述系统探讨了大数据分析在食品价值链中支持大规模食品强化(LSFF)和生物强化决策的应用与潜力。文章遵循PRISMA指南,分析了2012-2022年间开放获取的同行评审文献和灰色文献,发现相关研究数量有限但增长迅速,主要聚焦生产(60%)和投入(19.5%)环节。尽管大数据在LSFF和生物强化中的应用仍处于早期阶段,但区块链、物联网(IoT)、机器学习(ML)和人工智能(AI)等技术在强化产品追溯、营养缺口预测和贫血患病率分析等方面展现出显著价值。作者建议拓展大数据在分销、监管等未充分探索领域的应用,以提升决策效率与项目可持续性。

  

引言

隐性饥饿影响全球超过二十亿人,尤其在低收入和中等收入国家(LMICs),这些地区的饮食严重依赖主食,无法提供足够的必需微量营养素。微量营养素缺乏(MNDs)对幼儿和育龄妇女的健康造成严重影响,阻碍可持续发展目标的实现。大规模食品强化(LSFF)和生物强化是预防MNDs最具成本效益的措施之一,但两者均面临独特挑战:LSFF项目常受行业合规性、监管监控和部分地区持续强化不足的困扰;生物强化则需要农民的广泛采用及通过持续作物开发和市场整合实现长期可持续性。

尽管LSFF和生物强化被广泛认为是减少MNDs的有效策略,但仍需高质量的微量营养素摄入和消费模式数据来优化这些干预措施。这些数据对于确定添加何种微量营养素、添加到哪些食品以及添加量至关重要。然而,现有数据往往零散、过时或不标准化,限制了其在政策决策和LSFF及生物强化策略制定中的实用性。同时,第四次工业革命(Industry 4.0)正推动各行业的技术创新,通过整合大量数据(即大数据),制造商可以利用人工智能(AI)和机器学习(ML)自动化并优化分析流程,揭示变革性的商业见解。

大数据指的是庞大、复杂的数据集,结合多个变量,难以使用传统统计方法进行分析。最广泛引用的大数据定义是5-V模型,包括高容量(大量数据,通常超过TB或PB级)、高速度(数据生成速度快,如近实时流数据)、高多样性(来自多个来源的多种数据格式和结构)、高准确性(符合事实,与数据质量密切相关)和高价值(衍生信息为决策者提供比传统数据源更多的收益和见解)。尽管全球食品系统生成大量数据,农业和营养部门在利用Industry 4.0技术(如大数据和AI)方面进展缓慢,这些技术可以识别供应链低效、优化作物管理并提供饮食模式见解。

在LSFF和生物强化背景下,大数据具有显著潜力,可提高这些项目的效率、有效性和可持续性。例如,连接式配料器可以实时收集添加微量营养素预混料到主食中的数据;机器学习方法可以大规模预测强化产品中的营养素含量;公共卫生规划者可以将数据挖掘与机器学习结合,分析社交媒体上的饮食数据,并评估LSFF和生物强化倡议的社区级结果。尽管这些应用具有巨大潜力,但目前尚无关于利益相关者如何在LSFF和生物强化项目中利用大数据分析的全面综述。本研究旨在确定大数据方法在农业和营养中的承诺与挑战,特别是在LSFF和生物强化方面,并探索如何应用这些见解提高LSFF和生物强化项目的效率和有效性,同时解决现有局限性和考虑未来前景。

材料与方法

本研究采用范围综述方法,因其允许系统映射关于LSFF和生物强化中大数据应用的广泛且多样化的文献体系。该主题跨越多个学科,包括营养、农业、公共卫生和数据科学,证据基础零散且异质,先前无综合合成可用。范围综述在此类情境中特别有用,其目的不是评估干预措施的质量或有效性,而是探索研究活动的范围、范围和性质,澄清关键概念,并识别文献中的知识差距。

综述遵循PRISMA-ScR指南,提前制定协议以确保搜索策略、研究选择和数据提取的一致性。资格标准包括明确提及大数据、机器学习、AI或相关分析工具在LSFF、生物强化或更广泛食品系统中应用的记录。纳入标准包括开放获取、专注于食品价值链的大数据工具或方法、以及发表在同行评审期刊或来自可靠来源的灰色文献。排除标准包括仅关注预测建模而无大型数据集、主题超出大数据或食品系统范围(如可穿戴设备、可再生能源或动物研究)、以及2012年以前或以非英语发表的记录。

信息源包括2022年11月28日进行的两种独立搜索策略:方法1针对同行评审出版物,全面搜索五个数据库(PubMed、ScienceDirect、Cochrane系统综述数据库、SciELO和Google Scholar);方法2针对灰色文献,手动添加组织网站发布或通过标准Google搜索获取的材料。搜索策略旨在捕捉大数据分析与食品价值链的交集,关键词结合“大数据”、“机器学习”、“人工智能”、“数据挖掘”与“强化”、“生物强化”、“营养”、“加工”、“监控”等术语。

研究选择由两名评审员独立盲目筛选记录的标题、摘要和全文,分歧通过讨论解决。数据图表化使用Microsoft Excel中的结构化表单进行,提取变量包括出版年份、关注区域、数据源和分析方法类型。最后进行描述性数值摘要和分类,以总结数据。

结果

共识别30,101篇同行评审记录,过滤重复后剩余18,439篇潜在相关记录。筛选标题和摘要后,排除16,503篇无关记录,以及92篇无全文或非英语全文记录。对1844篇英语全文记录进行详细筛选,排除186篇不相关记录,最终纳入1658篇同行评审记录。灰色文献搜索检索326篇记录,筛选后排除32篇重复和265篇不相关记录,对29篇进行全文筛选,排除9篇不符合资格标准,最终纳入20篇灰色文献记录。总计分析1678篇记录。

结果显示,关于农业和营养领域大数据应用的出版记录庞大、多样且快速增长。2017-2022年间出版记录数(n = 1571)几乎是2012-2016年间(n = 107)的15倍。在所有记录中,28篇(同行评审文献n = 17;定向搜索n = 11)提及LSFF或生物强化,全部发表于2018-2022年间,其中2篇同时提及两者,15篇仅提及LSFF,11篇仅提及生物强化。

按国家和区域分类,针对特定国家的记录(n = 1027)中,34.2%(n = 351)位于东亚和太平洋地区,其次为南亚(21.7%,n = 223)和欧洲与中亚(14.5%,n = 149)。其余区域分布为:北美(11.1%,n = 114)、非洲(10.2%,n = 105)、拉丁美洲与加勒比地区(5.6%,n = 58)及中东与北非(2.7%,n = 27)。按国家划分,关注最多的为中国(24.8%,n = 255),其次为美国(10.9%,n = 112)和印度(10.4%,n = 107)。提及LSFF或生物强化的记录中,2篇关注非洲,2篇关注巴西,4篇关注印度,1篇关注印尼,其余为全球关注(n = 18)或欧洲区域关注(n = 1)。按收入组别,大多数记录关注高收入国家(47.9%,n = 819)和上中等收入国家(22.6%,n = 386)。在低收入组中,埃塞俄比亚占多数,13篇(48.1%)。

记录发表在386种同行评审期刊、9份在线报告、4份在线新闻发布和2篇网站博客中。同行评审期刊覆盖多个科学领域:农业(29.9%,n = 414)、生物学(13.4%,n = 223)、工程学(13.1%,n = 218)、信息与通信技术(12.3%,n = 205)、化学(12.2%,n = 202)、地球与环境科学(4.7%,n = 78)、生物医学研究(4.2%,n = 70)、赋能与战略技术(2.9%,n = 49)、临床医学(1.3%,n = 21)、社会科学(0.8%,n = 14)、经济与商业(0.8%,n = 14)、数学与统计学(0.5%,n = 8)、物理与天文学(0.5%,n = 8)、公共卫生与健康服务(0.4%,n = 6)、心理学与认知科学(0.3%,n = 5)、建筑环境与设计(0.2%,n = 4)及通信与文本研究(0.1%,n = 1)。122篇记录(7.3%,n = 121)发表在无科学分类的期刊中(如PLoS One)。

关于大数据源类型,遥感数据是最常提及的类型(53.8%,n = 902),包括提及LSFF或生物强化的记录(42.9%,n = 12)和未提及的记录(53.9%,n = 890)。其余类型包括计算机视觉与图像分析(30.2%,n = 507)、农场设备与机器人(10.1%,n = 170)、通过社交媒体和众包的移动电话(3.9%,n = 65)及研究数据(39.7%,n = 667)。

关于大数据分析类型,44%(n = 739)采用描述性分析,通常用于作物或环境仪表板、回顾性描述研究、土壤测绘或食品安全监控。预测分析次之(40.3%,n = 676),一般用于作物产量、作物胁迫(如耐旱性)、食品安全或保质期预测。诊断性分析占23.5%(n = 395),规范性分析占9.1%(n = 152)。

跨食品价值链维度,生产环节占比最大(60%,n = 1192),其次为投入(19.5%,n = 388)。提及与未提及LSFF或生物强化的记录分布不同:提及LSFF或生物强化的记录更关注公共卫生监控(16.7%,n = 7),而未提及的记录仅2.3%(n = 45)。其余维度包括加工与包装(8.3%,n = 165)、零售与营销(5.6%,n = 111)、监管(2.3%,n = 45)及分销(1.8%,n = 36)。

从1678篇记录中,28篇明确提及LSFF或生物强化,并识别出8个与这些干预直接相关的用例。这些应用包括使用区块链和IoT构建供应链追溯系统(监管)、利用机器人技术优化面包生产过程(生产与加工)、以及应用机器学习预测消费者对强化产品的偏好(零售与营销)。其他记录强调了可适应食品强化的农业和营养创新,如营养预警系统和大规模饮食数据分析用于公共卫生监控。

讨论

LSFF或生物强化中可用的大数据是什么?

几个世纪以来,数据一直是食品价值链各环节经验决策的基础,但这些数据通常仅在本地小单位收集,很少数字化,且利益相关者很少将其整合到大数据库中。如今,食品价值链各环节生成和管理大量结构化和非结构化数据。大数据在食品行业中的应用为整个价值链(从农场到餐桌)的优化和创新提供了重要机会。通过分析这些丰富信息,各级利益相关者(从农民到消费者)可以做出更明智和高效的决策。

尽管有此潜力,我们的发现表明LSFF和生物强化尚未完全受益于大数据革命。虽然农业和营养领域出现许多创新(如区块链用于供应链追溯和机器学习用于消费者洞察),但其在LSFF和生物强化中的直接应用仍然有限。可转移技术(如营养预警系统和饮食数据分析)可以增强LSFF和生物强化策略的决策制定;然而,显然需要更有针对性地探索和整合大数据在这一领域的应用。这些差距提供了弥合分歧并充分利用大数据潜力以推进强化工作的机会。

目前,仅有少数国家(如喀麦隆和巴勒斯坦)利用近期饮食摄入和MND数据指导LSFF项目设计。此外,关于ongoing LSFF项目质量和覆盖范围的数据并未在各國常规收集,这限制了决策者跟踪进展、识别和解决实施挑战的能力。

在线管理信息系统(如FortifyMIS和全球强化数据交换(GFDx))为营养研究、规划和政策社区提供有价值的国家项目数据访问。然而,这些系统不符合大数据标准。尽管FortifyMIS是有用的在线工具,用于收集和聚合强化监控数据,但其主要关注有限数据源,旨在惠及政策制定者和行业利益相关者。同样,GFDx是在线分析和可视化工具,聚合196个国家关于五种常见强化食品(玉米粉、油、米、盐和小麦粉)的数据,以展示进展或与相关全球目标和建议的一致性。要被视为大数据源,这些系统需要拥有来自更广泛来源的显著更大量数据(容量)、高数据摄入和处理速率以实时评估强化工作(速度)、并纳入多样化的数据类型(准确性)。

大数据沿食品价值链的使用

利益相关者日益利用大数据沿食品价值链提高效率、生产力和透明度。本范围综述揭示超过80%的记录关注投入和生产环节,特别是在农业和精准农业中。这些阶段生成广泛数据集,为作物健康、土壤条件和环境因素的决策提供信息。然而,如综述所示,监管和公共卫生监控等环节仅占相对较小比例——分别为2.3%和8.3%。这种分布揭示了这些关键领域内大数据应用的显著差距。

在加工、监管和公共卫生监控中应用大数据可以解决LSFF和生物强化中的关键挑战,如确保合规性、优化营养素输送和监控公共卫生结果。LSFF和生物强化与食品价值链的每个维度相关,从生产到公共卫生监控。然而,本范围综述分析的1678篇记录中仅有28篇提及LSFF或生物强化。尽管文献有限,但存在明确机会更有效地整合大数据跨价值链以增强LSFF和生物强化工作。下文回顾本范围综述中包含的记录中描述的沿食品价值链的大数据使用,并强调LSFF和生物强化部门的机会。

投入

在农业中,利益相关者利用大数据提高效率和生产力,同时最小化浪费和减少环境影响。本范围综述强调智能农业和精准农业方法如何生成大量可分类为大数据的农业数据。精密农场设备和机器人配备GPS导航系统和杂草管理传感器,利用来自卫星和地面系统的遥感数据。大型农场上的机械臂使用大数据算法收获水果并评估最佳成熟度和营养价值。自主机器人还通过机器学习训练生成土壤样本数据,如实时映射土壤pH值和矿物质含量。在作物监控和风险管理中,农民使用卫星数据监控作物生长、健康和环境因素(如天气模式或害虫),这些因素可能影响作物产量和质量。

许多现有赋能技术还支持农业部门的预测分析和供应链优化。预测分析和供应链优化使用大数据分析天气模式、市场趋势和其他因素,以预测未来作物产量和价格。这些信息可以帮助农民做出关于种植、收获和营销作物的明智决策。例如,农场级大数据模型的见解可能表明,由于特定天气模式,原材料可能具有较高水平的毒素(如黄曲霉毒素),这可以引导农民制定适当的缓解措施。

在农业中使用大数据提供了加强LSFF或生物强化投入的机会。例如,了解主食作物的天然微量营养素含量可以帮助确定食品生产过程中添加预混料的适当量,确保最佳强化水平。此外,决策者可以应用预测分析和供应链优化评估天气模式、市场趋势和其他变量,以预测作物产量和营养素含量——实现关于作物选择和生物强化工作的更战略决策。移动电话技术的增加使用还允许小农访问大数据并接收关于生物强化作物良好农业实践的建议。

加工与包装

为实现优化生产过程、提高效率和减少浪费,食品加工和包装过程通过识别低效和改进机会进行优化。机器性能、生产时间或库存水平可以提供相关信息。从给定生产单元内的原材料到成品或从农场到餐桌的整个生产过程中的可追溯性和质量控制为监管者提供信息,以识别和预防质量问题 before they become a significant problem,或改进生产过程。改善食品安全有助于识别加工和包装过程中的潜在安全问题并防止其发生。调查者可以使用机器学习和来自社交媒体或公共卫生报告的大数据快速识别食源性疾病爆发中的污染源。

大数据可能是优化强化和生物强化食品产品加工与包装的强大工具。通过分析机器性能、生产时间和库存水平,大数据可以识别改进机会,从而提

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号