美国联邦与州级政策研究新工具:CongressData与Correlates of State Policy数据库的构建与应用

【字体: 时间:2025年07月11日 来源:Scientific Data 5.8

编辑推荐:

  本研究为解决美国政治科学领域数据分散、标准化不足的问题,由Michigan State University团队开发了CongressData(1789-2024年国会成员数据库)和Correlates of State Policy(CSPP,1900-2020年州政策数据库),分别整合1,000+和3,000+变量,提供R包和交互式平台支持跨学科研究。成果发表于《Scientific Data》,推动政策效应分析与历史比较研究。

  

在美国政治与政策研究中,长期存在数据碎片化、时间跨度有限和跨州比较困难等问题。学者们往往只能聚焦特定时段或局部区域,如国会研究多限于单届议会周期,州政策分析受限于变量不统一。这种数据壁垒严重阻碍了对政策演变规律和治理效果的系统性认知。

为破解这一困局,密歇根州立大学(Michigan State University)的Matt Grossmann团队联合印第安纳大学伯明顿分校(Indiana University-Bloomington)的研究人员,构建了两大创新性数据库:CongressData覆盖1789-2024年所有国会成员年度数据,Correlates of State Policy(CSPP)囊括1900-2020年50州及华盛顿特区的政策指标。相关成果以数据描述形式发表于《Scientific Data》。

研究采用标准化数据整合技术:通过国会成员Bioguide ID、ICPSR代码等唯一标识符串联分散数据集;建立州名-年份矩阵合并异构政策变量;开发自动化校验流程检测异常值。关键突破在于创建统一分析单元——CongressData以"成员年"(member-years)为基准规避选区重划干扰,CSPP采用"州年"(state-years)实现纵向可比。

数据架构与内容
CongressData整合四大类变量:法案提案数据(bill introduction)、选区人口特征(district demographics)、议员属性(member characteristics)及委员会任职(committee membership)。其变量分布显示,立法行为与选区特征占比最高,如

所示。CSPP新增1,000+变量,重点扩充经济政策、劳工权益与环境规制指标,形成16类政策标签体系,其变量增长趋势见

技术验证与创新
通过国会官网Bioguide ID交叉验证,实现99.7%匹配率。多重标识符设计(ICPSR代码、Wikidata ID等)解决名称歧义问题,如"Dave Weldon"与"David Weldon"的标准化关联。数据工具链包含CRAN发布的R包(cspp、CongressData)和交互式网络应用,支持变量筛选、可视化及自动生成引用格式。

这项研究的意义在于创建了政治科学研究的"基础设施":CongressData使学者能检验立法有效性(Legislative Effectiveness Score)与选区特征的百年关联,CSPP支持分析政策扩散(policy diffusion)如枪支法对犯罪率的跨州影响。开放式工具设计降低了非政治学领域研究者的使用门槛,例如公共卫生学者可快速提取各州医疗政策与健康指标的协同变化。

未来工作将持续扩展数据库时空覆盖,尤其填补20世纪前期州级政策空白。这种动态更新机制与协作模式(用户可直接邮件反馈数据问题)为社会科学数据治理提供了范本,其方法论更可推广至其他国家或地区的政策研究。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号