大规模个人移动位置数据在食品采购分析中的潜力与局限性
《Health & Place》:Potentials and limitations of large-scale, individual-level mobile location data for food acquisition analysis
【字体:
大
中
小
】
时间:2025年08月06日
来源:Health & Place 4.1
编辑推荐:
个体GPS轨迹分析揭示杰克逊维尔食物获取行为的空间时间模式及算法偏差问题,指出GPS数据在捕捉高频次、多地点访问行为方面具有优势,但存在数据覆盖不均、访问频率低估及算法设计敏感性等局限,强调数据代表性评估与隐私保护的重要性。
理解食品获取行为对于制定应对粮食不安全的策略至关重要,而粮食不安全是全球公共卫生领域的一个重要议题。随着大规模移动位置数据的出现,尤其是全球定位系统(GPS)数据,这种数据能够以高时空分辨率记录人们的移动轨迹,为研究食品获取提供了全新的视角。本研究使用了来自佛罗里达州杰克逊维尔市的2.86亿条GPS记录,分析该地区居民的食品零售点访问行为。通过评估数据覆盖范围、检验GPS衍生指标的适用性,以及探讨提取这些指标时方法论决策对研究结果的影响,我们发现GPS数据能够揭示个体层面的多样化时空模式,从而提供关于食品获取行为的有价值见解。然而,我们也发现数据覆盖存在偏差,访问频率可能被显著低估。敏感性分析进一步表明,研究结果对算法设计选择具有高度依赖性。本研究强调了GPS数据在基于地点的健康研究中的价值,同时指出了在数据覆盖和代表性、算法设计的反思性、隐私问题以及研究结果的更广泛社会影响方面需要更加谨慎地进行评估。
食品不安全是指缺乏稳定、充足的、安全且营养丰富的食物以维持健康、活跃的生活方式,这一现象在世界范围内引发了广泛关注。根据相关研究,2023年美国有13.5%的家庭经历了粮食不安全。要解决这一问题,关键在于深入了解食品获取的过程,即人们如何从食品销售场所获取食物。传统的研究方法通常依赖于问卷调查,这些调查能够收集详细的食品获取行为数据,包括购物习惯、支出情况和食物消费模式。问卷调查不仅支持不同群体之间的比较,还能够进行纵向分析。此外,访谈和焦点小组讨论也能提供定性信息,例如文化和社会经济因素如何影响食品获取。然而,这些方法往往依赖于个人的记忆来报告与食品商店访问相关的时空信息,可能导致偏差、不准确以及有限的时空分析能力。
近年来,研究人员开始利用GPS设备来补充传统方法,例如进行地理标记的调查,或分发跟踪设备以记录地理围栏访问或移动轨迹。通过高分辨率的GPS数据,研究人员能够更精确地重建人们的活动和出行模式,支持更深入的时空分析。例如,可以基于活动空间分析食品暴露情况,而不仅仅局限于家庭或工作场所。然而,收集GPS增强的调查数据需要大量资源,因此通常只能获得较小的样本量,使得难以覆盖具有代表性的参与者群体。已有研究回顾了GPS与食品环境暴露相关的论文,指出样本量通常在12到654人之间。此外,研究人员还注意到,携带监测设备的意识可能会导致行为变化,从而影响研究结果。
随着智能手机和智能手表等具有位置功能的移动设备的普及,大规模GPS数据的收集变得越来越常见。这些数据通常由位置追踪应用程序生成,并由数据供应商如SafeGraph、Cuebiq和Gravy Analytics提供给研究界。这些数据集能够记录数百万个体在数周、数月甚至数年内的移动轨迹,具有米级和秒级的时空分辨率。这种数据为研究人类移动模式提供了新的方法,例如分析食品零售点访问与健康和社会结果之间的关联。目前,大多数研究分析这些数据时采用的是聚合层面的数据,如人口普查区或兴趣点(POIs),部分原因是SafeGraph在2020年至2023年间向全球研究人员免费提供了聚合层面的移动位置数据。尽管聚合层面的数据能够提供关于人类移动的有价值信息,但它们无法分析个体层面的行为差异。
本研究通过分析一个独特的数据集——佛罗里达州数百万个体的GPS移动轨迹,探讨了大规模、纵向、个体层面GPS数据在食品获取分析中的潜力与局限性。我们首先介绍了处理原始GPS数据以提取食品获取相关指标的分析步骤。通过分析这些步骤中的算法设计考虑和参数选择,我们揭示了GPS数据处理中的算法不确定性如何影响研究结果。随后,我们以佛罗里达州杰克逊维尔市为案例,讨论了利用大规模GPS数据进行食品获取分析相较于传统方法的优势与局限性。具体而言,我们识别了GPS数据在分析个体层面的食品获取行为时空模式方面能够提供的新见解,同时也探讨了数据代表性不足和算法不确定性可能带来的限制。通过检验数据覆盖情况和评估研究结果对关键参数选择的稳健性,我们进一步揭示了GPS数据在食品获取分析中的应用价值。
在方法部分,我们详细描述了如何从原始移动位置数据中提取食品获取指标。这一过程首先涉及对移动电话GPS数据的处理,以推断每个设备用户的家庭位置和活动(或停留)情况,从而获得其活动-出行模式。随后,我们整合GPS数据,以识别个体访问食品零售点的时空模式。这一过程中的关键步骤包括数据清洗、时空聚合、活动识别以及空间可达性分析。这些步骤不仅涉及对GPS数据的处理,还包含了对算法设计和参数选择的深入考量。例如,在进行活动识别时,不同的算法可能会导致不同的结果,因此需要选择适合研究目的的算法,并进行相应的参数调整。此外,在进行空间可达性分析时,需要考虑不同距离和时间窗口对结果的影响,以确保研究结果的准确性。
在案例研究部分,我们进一步分析了佛罗里达州杰克逊维尔市的GPS数据,以探讨其在食品获取分析中的应用潜力。我们首先描述了研究区域和数据来源,然后检验了数据覆盖范围和代表性。通过分析GPS数据的采样频率和推断出的食品获取访问情况,我们评估了数据的覆盖程度。随后,我们探讨了从GPS数据中提取的关键食品获取指标及其相关的时空模式,以判断GPS数据在分析食品获取行为方面的有效性。此外,我们还分析了GPS数据在不同时间窗口和不同距离阈值下的表现,以评估研究结果的稳健性。
本研究展示了GPS数据在食品获取分析中的巨大潜力。GPS数据能够以高时空分辨率记录个体的移动轨迹,从而提供关于食品获取行为的详细信息。这种数据的高分辨率使得研究人员能够分析个体在不同时间点和不同空间位置的食品获取行为,而不仅仅是基于家庭或工作场所的静态数据。此外,GPS数据能够覆盖更大的地理范围,使得研究人员能够分析不同区域之间的食品获取行为差异。这种数据的广泛覆盖能力使得研究人员能够更全面地理解食品获取行为的分布情况。然而,GPS数据在应用过程中也存在一些局限性。例如,数据覆盖可能存在偏差,某些群体可能被低估或忽略,这可能导致研究结果的不准确。此外,GPS数据的处理过程中的算法设计选择可能会对结果产生显著影响,因此需要仔细考虑和验证。
在结论部分,我们总结了本研究的主要发现。大规模移动位置数据为研究人类移动提供了新的方法,而本研究则系统分析了GPS数据在食品获取分析中的潜力与局限性。通过使用包含2.86亿条GPS记录的大规模数据集,我们进行了一项案例研究,分析了杰克逊维尔市居民的食品获取行为。我们推断了文献中常见的食品获取指标,并探讨了这些指标的时空模式。研究结果表明,GPS数据能够提供关于食品获取行为的有价值信息,但同时也存在数据覆盖偏差和算法不确定性等挑战。因此,研究人员在使用GPS数据进行食品获取分析时,需要充分考虑数据的覆盖范围和代表性,以及算法设计的合理性和敏感性。
本研究还强调了在使用GPS数据进行食品获取分析时,隐私问题的重要性。由于GPS数据能够记录个体的移动轨迹,因此需要采取适当的隐私保护措施,以确保数据的安全性和合规性。此外,研究结果的更广泛社会影响也需要被充分考虑,例如如何利用这些数据来制定更加公平和有效的政策,以改善食品获取情况。因此,研究人员在使用GPS数据进行食品获取分析时,需要在数据的科学性和伦理责任之间取得平衡。
综上所述,本研究通过分析佛罗里达州杰克逊维尔市的大规模GPS数据,探讨了GPS数据在食品获取分析中的潜力与局限性。我们发现,GPS数据能够提供关于个体层面食品获取行为的详细信息,但同时也存在数据覆盖偏差和算法不确定性等挑战。因此,研究人员在使用GPS数据进行食品获取分析时,需要充分考虑数据的覆盖范围和代表性,以及算法设计的合理性和敏感性。此外,还需要关注隐私问题,并考虑研究结果的更广泛社会影响。通过这些分析,我们希望为未来的研究提供有价值的参考,并推动GPS数据在食品获取分析中的更广泛应用。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号