
-
生物通官微
陪你抓住生命科技
跳动的脉搏
墨西哥市政选举的精细化研究:1994-2019年选区级选举数据库构建与应用
【字体: 大 中 小 】 时间:2025年04月08日 来源:Scientific Data 5.8
编辑推荐:
为解决墨西哥市政选举数据分散、标准化不足的问题,Bruno Calderón-Hernandez等研究人员构建了1994-2019年涵盖456,051个选区、15,581场选举的精细化数据库。该研究整合PRI/PAN/PRD/MORENA四大政党联盟数据,通过R语言标准化流程解决选区重划和联盟变动难题,相关系数达0.814-0.94的验证表明其可靠性,为研究地方选举动态和执政党效应提供了关键工具。
墨西哥的政治版图在过去几十年经历了从革命制度党(PRI)一党独大到多党竞争的深刻变革,这种转变在地方选举中尤为显著。然而,系统性研究墨西哥市政选举面临两大挑战:各州选举机构公开数据的质量和数量参差不齐,以及由于市长不能连任(2018年前)和跨党联盟频繁变动导致的执政党支持率测量困难。这些挑战使得学者们难以开展精细化的选举研究,而此类研究对于理解地方治理、选民行为和政党竞争机制至关重要。
为突破这些限制,来自墨西哥自治技术研究所、哥伦比亚大学的研究团队构建了一个开创性的数据库。这项工作整合了Horacio Larreguy、John Marshall等学者先前收集的数据,涵盖1994-2019年间31个墨西哥州(不含墨西哥城)的市政选举。数据库包含456,051条选区级选举记录,涉及15,581场市政选举、62,341个独特选区和2,033个城市,时间跨度达25年,为研究墨西哥地方政治动态提供了前所未有的精细数据。
研究团队开发了一套完整的R语言数据处理流程。首先从各州选举机构网站或信息公开申请获取原始数据(CSV/Excel/PDF格式),通过光学字符识别(OCR)技术处理历史文档。随后建立标准化命名体系,使用国家统计地理研究所(INEGI)的编码系统统一行政区划标识。针对复杂的联盟投票情况(如选民可投给联盟整体、单个成员党或任意组合),开发了专门的聚合算法。为处理执政党识别难题,团队结合Magar市政选举数据库和SNIM系统数据,并通过人工核查地方报纸、政府网站等验证了118个争议案例。最后通过计算相关系数(0.814-0.94)验证了与INE官方数据的一致性。
数据库的核心价值体现在四个维度:首先,它首次系统收录了选区层级的完整投票数据,包括四大政党(PRI、PAN、PRD、MORENA)及其联盟的得票情况。其次,创新性地构建了执政党支持率指标,通过追踪前任市长所在政党在当前选举中的表现,解决了联盟变动带来的测量难题。第三,整合了选民登记数和投票率数据,其中登记选民数据通过向国家选举委员会(INE)申请信息公开获得补充。第四,包含市级和州级执政党历史投票数据,支持差异中的差异(DID)和回归不连续性(RD)等高级分析方法。
技术验证环节凸显了数据的可靠性。与INE官方公布的2015-2018年选区投票率数据相关系数达0.979(49,675个观测值)。表6显示,市级聚合数据与Magar数据库的四大政党得票率相关系数均在0.8以上,其中民主革命党(PRD)和国家复兴运动党(MORENA)的相关系数超过0.9。研究还处理了非常规选举问题,如表4和表5所示,团队根据选举无效原因(如票数并列、宗教干预等)选择了最具代表性的21个案例纳入分析。
这项研究在方法论上有三大创新:一是开发了可处理墨西哥复杂联盟政治的数据标准化流程;二是建立了首个覆盖全国、时间跨度达25年的选区级选举数据库;三是提出了解决地方选举中执政党识别难题的操作方案。这些创新使研究者能够以前所未有的精度分析地方选举动态,比如考察审计报告发布(如Larreguy等2020年研究)或地方媒体报道对选举问责的影响。
数据库的应用前景广阔。在学术层面,支持两种重要研究设计:面板数据分析可追踪选区层面的政治倾向变迁;精确地理边界的回归不连续性设计能有效估计执政党效应。在政策层面,为评估选举制度改革(如2014年INE成立带来的标准化效应)提供了基准数据。值得注意的是,数据揭示了联盟政治的重要趋势——如图2所示,1997-2019年间采用选举联盟的城市比例总体呈上升趋势,但2019年因三个州未与联邦选举同步出现异常下降。
研究也存在一定局限。约0.58%的执政党数据因信息缺失无法确定;少数选区投票率超过100%需剔除;对挑战者联盟的识别尚未完成系统人工核查。这些都为后续研究指明了改进方向。
该数据库的发布标志着墨西哥选举研究进入"大数据"时代。正如美国选区级选举结果数据集和西班牙选举档案(SEA)推动了两国政治学研究,这项工作为比较政治学提供了重要案例。特别值得关注的是,数据捕捉了2018年关键转折点——MORENA的崛起打破了传统政党格局,而新执政联盟模式的形成过程正蕴含在这些精细的选区数据中。
未来研究可沿三个方向拓展:一是结合人口普查数据研究选区社会经济特征与投票行为的关系;二是利用空间分析方法考察选区重划的政治影响;三是追踪2018年后市长连任制度改革的效果。随着墨西哥民主化进程的深入,这个持续更新的数据库将成为学界和实务界不可或缺的工具。
生物通微信公众号
知名企业招聘