利用谷歌位置历史数据解析消费者与食品店交互行为:生命科学领域洞察饮食与健康关系的新视角

【字体: 时间:2025年02月16日 来源:International Journal of Health Geographics 3

编辑推荐:

  为解决传统饮食行为研究方法的局限,华盛顿州立大学的研究人员开展利用 GLH 数据识别消费者与食品店接触的研究。他们发现不同食品店的访问模式差异,此研究为饮食行为研究、政策制定等提供新视角,值得科研读者一读。

  
华盛顿州立大学(Washington State University)的 Olufunso Oje 等人在《International Journal of Health Geographics》期刊上发表了题为 “Use of individual Google Location History data to identify consumer encounters with food outlets” 的论文。这篇论文在健康地理学以及公共健康营养研究领域意义重大,它为深入探究食物环境与饮食行为之间的关系提供了全新的视角和研究方法,有助于推动公共健康政策的制定以及城市规划的优化,以促进人们形成更健康的饮食习惯 。

一、研究概述


该研究旨在利用谷歌位置历史(Google Location History,GLH)数据,客观地检测和量化消费者与食品店的接触情况,进而分析饮食行为与食物环境之间的关系。在过去,评估饮食摄入和行为的传统方法,如自我报告措施,存在回忆偏差和社会期望影响等问题,限制了其可靠性。而地理信息系统(Geographic Information System,GIS)技术虽在研究食物获取和可用性方面取得了进展,但主要聚焦于家庭住址周边区域,过度简化了食物获取动态,可能高估邻里食物环境的重要性。此外,可穿戴全球定位系统(Global Positioning System,GPS)技术在捕捉长期饮食行为方面也存在局限性。随着智能手机等日常技术产生的大数据的出现,为健康地理研究开辟了新途径。GLH 数据能够提供连续、被动的地理位置信息,本研究正是基于此,通过分析 GLH 数据来揭示消费者与食品店的互动模式。

二、研究方法


  1. 数据来源与收集:研究数据主要来源于华盛顿州双胞胎登记处(Washington State Twin Registry,WSTR)的 357 名参与者的 GLH 数据,这些数据包含了经度、纬度坐标、时间戳以及测量精度等信息,共计超过 2.87 亿条记录。同时,研究还利用了 INFOUSA/DATA AXLE 商业数据集,该数据集提供了华盛顿州食品店的位置坐标、地址等详细信息,研究人员依据北美行业分类(North American Industry Classification,NAICS)代码筛选出食品店数据进行分析。
  2. 定义食品店访问:由于 GLH 数据中地点访问分类缺乏详细的准确性和可靠性信息,且部分访问仅以地址表示,给识别和分类带来困难。研究人员围绕每个食品店构建了缓冲区,以参与者进入和离开缓冲区且在规定时间内不再返回作为一次访问的判定标准。为确保准确识别访问,研究设定了多个关键参数。
    • 位置精度:选择精度半径小于 50 米的位置点进行分析,以减少误判访问的可能性。
    • 缓冲区尺寸:根据不同食品店类型的中位数物理尺寸,为各类食品店设定了不同的缓冲区尺寸。例如,便利店为 25 米,超市为 35 米等。
    • 访问持续时间:设定最小停留时间为 3 分钟,以区分真正的访问和路过;最大停留时间为 3 小时,排除非典型光顾情况;重访间隔也设为 3 小时,用于准确合并访问记录。

  3. 数据处理流程
    • 初始过滤位置数据:根据位置点的精度对原始位置数据进行筛选。
    • 构建初步访问列表:将位于食品店缓冲区范围内的位置点提取出来。
    • 合并访问列表:利用重访间隔参数合并连续的访问,减少冗余。
    • 确定最终访问列表:应用最小和最大停留时间参数,确定有效的访问记录。
    • 标准化访问数据:根据参与者在活动区域内的时间,对访问数据按日、周、月、年进行标准化处理。

  4. 敏感性分析与对比分析
    • 敏感性分析:对五个关键参数(位置精度、缓冲区尺寸、最小停留时间、最大停留时间、重访间隔)进行敏感性分析,每次改变一个参数的值,其他四个参数保持不变,以评估每个参数对检测到的访问次数的影响。
    • GIS 对比与邻近分析:基于 GIS 技术计算参与者家周围 1 公里和 2.5 公里范围内超市和有限服务餐厅的密度指标,并与 GLH 数据中食品店访问情况进行关联分析。
    • GLH 地点访问对比:运用模糊文本匹配技术,将 GLH 数据与食品店数据集的 NAICS 代码和描述进行匹配,设定 “位置置信度” 和 “访问置信度” 阈值为 70 及以上,模糊文本匹配分数为 85 及以上,对比分析结果与研究方法检测结果的差异。


三、研究结果


  1. 参与者特征与数据概况:357 名参与者的 GLH 数据收集时间跨度为 2010 年至 2023 年,每位参与者的数据持续时间差异较大,从 3 天到 3938 天不等,中位数为 1310 天,平均值为 1428 天。这些数据在时间和空间上都具有广泛的覆盖范围。
  2. 食品店访问检测:研究共识别出 156,405 次对 5098 家独特食品店的访问。不同类型食品店的访问分布差异明显,其中全服务餐厅的访问次数最多,占比 60%;有限服务餐厅占 15%;超市占 16%。参与者在不同类型食品店的停留时间也有所不同,在全服务餐厅和果蔬市场停留时间较长,而在便利店停留时间较短。在 357 名参与者中,仅有 297 人有记录访问,可能是部分参与者在缓冲区停留时间不足或不在活动区域内。
  3. 敏感性分析结果:缓冲区尺寸对检测到的访问次数影响最大,减小 10 米会使检测到的访问次数约为 78,000 次,增大 10 米则会超过 253,000 次。最小停留时间的调整也有较大影响,缩短至 1 分钟可识别出超过 222,000 次访问,延长至 5 分钟则识别出超过 130,000 次访问。位置精度也有一定敏感性,而重访间隔和最大停留时间单独作用时影响较小,可能存在相互关联。
  4. GIS 对比与邻近分析:不同类型食品店的访问频率与家周围的密度存在不同关系。便利店、百货商店和果蔬市场在 2.5 公里半径内的访问频率高于 1 公里半径;全服务餐厅和有限服务餐厅则相反,离家越近访问频率越低,在 2.5 公里半径内有所增加。超市和有限服务餐厅在 1 公里范围内,其数量与访问频率的斯皮尔曼系数分别为 0.58,呈显著正相关,2.5 公里处相关性依然显著但略有减弱。Cohen's Kappa 统计显示,总体上食品店邻近度与访问率的一致性为低到中等。
  5. GLH 地点访问对比:通过模糊文本匹配,在 190 万条记录中成功匹配 102,383 条与食品店相关的记录。研究方法检测到的全服务餐厅访问次数(93,357 次)远高于 GLH 数据(27,220 次),而百货商店和仓储俱乐部及超级中心的访问次数则低于 GLH 数据。模糊匹配在分数低于 90 时存在挑战,可能导致记录误判。

四、研究结论与讨论


  1. 访问模式解读:研究发现参与者在全服务餐厅和果蔬市场的停留时间较长,可能反映出他们对健康饮食或社交用餐的偏好;便利店访问时间短,体现其功能性购买特点。这与 “15 分钟城市” 模型研究结果相符,表明当地可达性对消费者行为和饮食选择有重要影响。同时,全服务餐厅和有限服务餐厅访问次数的差异,为研究不同餐饮场所的饮食摄入质量提供了线索,强调在研究食物环境对饮食选择的影响时,需综合考虑多种因素。
  2. 与传统数据收集方法对比:传统的 GIS 技术在营养流行病学研究中虽有一定作用,但存在局限性,如过度简化食物获取动态、难以描绘长期饮食模式等。GLH 数据则避免了自我报告的不准确问题,能更精确地重建个人食品店访问模式,提供连续客观的记录,且结合 GIS 技术进行空间分析,能更深入地理解食物环境对饮食行为的影响。然而,GLH 数据缺乏饮食摄入的定性信息,不能完全替代传统数据收集方法,两者结合才能更全面地研究饮食、环境和健康之间的关系。
  3. 研究局限性与未来研究方向
    • 地理局限性:研究仅针对华盛顿州的食品店,结果可能不适用于其他地区,未来研究应扩大地理范围。
    • 食品店数据的时间局限性:食品店数据集是静态的,无法反映店铺运营状态的变化,未来研究需使用动态数据。
    • 店铺位置的模糊性:存在多个食品店坐标相同的情况,影响访问识别准确性,未来应改进空间数据处理技术。
    • 政策变化影响数据可用性:谷歌位置历史政策的变化限制了研究数据的获取,需寻找替代数据收集方法或调整研究设计。
    • 未来方向:未来研究可通过整合更多数据层、创新算法等改进空间数据处理,还应直接探索建筑环境对食物选择和饮食的影响,并结合详细饮食摄入信息进行研究。

  4. 政策、规划和健康地理意义:本研究为公共卫生政策制定者提供了消费者在不同食品店行为的详细信息,有助于制定促进健康饮食的针对性干预措施。在城市规划方面,可指导社区布局设计,平衡不同类型食品店的分布。在健康地理学领域,推动了多学科研究方法的发展,为进一步研究人、地点和健康之间的复杂关系奠定了基础。

综上所述,该研究利用 GLH 数据在食品店访问模式分析方面取得了重要进展,为理解食物环境对饮食行为的影响提供了新的方法和视角,对公共健康政策制定、城市规划和健康地理学研究都具有重要的指导意义。尽管研究存在一定局限性,但为未来研究指明了方向,有望推动相关领域的进一步发展,促进人们养成更健康的饮食习惯,提升公共健康水平。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号