
-
生物通官微
陪你抓住生命科技
跳动的脉搏
时空条件泊松点过程的变量选择方法及其在犯罪热点预测中的应用
【字体: 大 中 小 】 时间:2025年06月28日 来源:Computational Statistics & Data Analysis 1.5
编辑推荐:
本文针对时空点模式数据建模中的变量选择难题,提出了一种基于正则化方法的参数化log-linear强度函数建模框架。研究团队通过构建空间、时间和时空协变量的分层惩罚机制,开发了坐标上升算法求解模型,成功应用于波哥大Kennedy区车辆盗窃数据的分析。该研究首次实现了时空泊松点过程中多类型协变量的同步选择,为犯罪热点预测提供了可解释的建模工具。
在犯罪学与环境科学领域,时空点模式数据正成为揭示事件分布规律的关键载体。传统空间统计方法虽能处理静态分布,却难以捕捉犯罪事件在时间维度上的动态演化特征。更棘手的是,当面对城市环境中的多重协变量——从静态的街道布局到动态的犯罪传染效应,现有方法既缺乏统一的变量选择框架,也受限于计算复杂度。这正是D'Angelo等人在《Computational Statistics》发表研究试图突破的瓶颈。
该研究创新性地构建了条件泊松点过程模型,其核心是将强度函数分解为空间ρ1(u;β1)、时间ρ2(t;β2)和时空交互ρ3(u,t;β3)三个可加组分。关键技术包括:1) 采用分层LASSO惩罚实现不同协变量类型的差异化选择;2) 设计坐标上升算法处理非凸优化问题;3) 利用Bogota犯罪记录的时空数据集验证模型,包含车辆盗窃点模式与21类城市环境协变量。
Spatio-temporal point processes and the intensity model
通过定义在R2×Z上的随机过程框架,建立条件强度函数λ(u,t|Ht)的log-linear参数化形式。模型创新点在于允许空间协变量(如距警局距离)、时间协变量(如季节因子)和时空协变量(如前期犯罪传染效应)共同作用于当前事件发生率。
Simulation study
两个数值实验证明方法优越性:研究1验证空间-时间可分离协变量的选择准确率达89%;研究2在加入非可分离项后,模型仍保持83%的真阳性率。特别发现时空交互项的识别需要至少50个时间点的观测数据支撑。
Application: crimes in Bogota
对Kennedy区12个月车辆盗窃数据的分析显示:1) 空间维度上,公交站点500米内风险提升2.3倍;2) 时间维度上,周末效应系数达0.47;3) 时空交互揭示盗窃事件存在72小时的近邻重复效应。
Concluding remarks
该研究首次实现时空点过程中多类型协变量的同步选择与解释,其分层正则化框架可扩展至地震预测、传染病建模等领域。方法学突破在于解决了传统方法对时空非可分离效应的建模局限,为公共安全决策提供了量化分析工具。值得注意的是,模型在超高维协变量场景下的计算效率仍有提升空间,这为后续研究指明了方向。
生物通微信公众号
知名企业招聘