编辑推荐:
研究人员为解决研究西班牙人群意识形态偏好及代际变迁难题,开展构建西班牙队列意识形态数据库(SCID)的研究。通过整合超 500 万观测数据,生成 1554 张表。这为研究社会政治变化提供多视角依据,意义重大。
在社会政治领域,理解一个国家民众的意识形态偏好至关重要,它就像一把钥匙,能打开洞察社会和政治变迁的大门。过往研究发现,意识形态偏好不仅反映个人政治倾向,还深受代际、人口结构以及社会经济因素的影响。例如,曼海姆的 “易受影响年理论” 指出,人们的政治身份在年轻时构建,且会伴随一生;社会身份理论也表明,与特定信仰体系的意识形态契合度越高,人们就越难改变立场,且更易认同代表这些信仰的团体。
然而,研究意识形态偏好的代际变化并非易事。以西班牙为例,虽然西班牙社会学研究中心(CIS)长期收集数据,但由于调查设计和测量意识形态的量表随时间变化,给研究人员对比不同时期的意识形态偏好带来了极大挑战。在近 60 年里,CIS 使用过多达 28 种不同量表,这就好比用不同的尺子去测量同一物体,得出的结果难以比较,使得这些数据的价值未能充分发挥。
为了攻克这些难题,来自西班牙巴伦西亚大学(GIPEyOP, Universitat de Valencia)的研究人员克里斯蒂娜?艾巴尔(Cristina Aybar)、比希略?佩雷斯(Virgilio Pérez)和何塞?M. 帕维亚(Jose M. Pavía)开展了一项极具意义的研究。他们构建了西班牙队列意识形态数据库(Spanish Cohort Ideology Database,SCID),旨在系统分析西班牙人群的意识形态偏好及其代际变迁。该研究成果发表在《Scientific Data》上,为社会政治领域的研究提供了新的视角和有力工具。
研究人员在构建 SCID 时,运用了多种关键技术方法。首先,他们从 CIS 数据库中收集了自 1977 年以来的 1800 多项调查数据,这些数据包含超过 500 万个基本观测值,平均每项研究涉及 156 个变量。接着,通过文本挖掘和自然语言处理技术,筛选出关键变量,如调查年份(YEAR)、受访者年龄(AGE)、意识形态自我定位(IDEOLOGY)、性别(GENDER)、居住地区(CCAA)和教育程度(EDUCATION)。针对意识形态自我定位变量存在多种量表的问题,研究人员将其统一转换为 1 - 10 量表,以确保数据的可比性。此外,为提高数据估计的质量和稳健性,他们采用双移动窗口(multivariate rolling windows)技术,整合相邻时期和年龄的数据,减少方差。
在研究结果方面:
- 构建多维度数据库:基于筛选后的变量,研究人员构建了包含年龄 - 年份和年龄 - 代际的表格,涵盖总体人群以及按性别、教育程度、性别与教育程度组合、地区细分的人群。这些表格不仅展示了平均意识形态演变,还提供了样本数量和方差信息,共生成 1554 张表格,全面呈现了西班牙人群意识形态偏好的分布和变化。
- 双移动窗口技术优化数据:双移动窗口技术有效增加了每个年龄 - 年份对的观测数量。不同窗口配置,如 1×3、3×1、3×3、1×5、5×1 和 5×5,在平衡方差和偏差的同时,提升了数据的统计可靠性。较小窗口保留了时间或年龄特异性的粒度,较大窗口则进一步降低方差,从不同角度反映意识形态变化趋势。
- 可视化呈现意识形态趋势:通过热图可视化不同窗口配置下的平均意识形态自我定位,能清晰看到滚动窗口的聚合作用减少了噪声,更易识别意识形态演变的总体模式,尤其是对于样本量较小的队列。
研究结论和讨论部分,SCID 的构建意义重大。它为研究西班牙社会和政治变化过程提供了全面的视角,使研究人员能从横截面和纵向两个维度分析意识形态变迁。例如,通过这些数据,研究人员可以追踪特定代际群体的意识形态趋势,评估历史事件对不同代际意识形态偏好的影响,识别某些意识形态是 “代际根源性” 的还是受年龄、历史背景因素影响。此外,还能预测未来意识形态格局,为政党和政策制定者提供参考,助力他们制定更符合民意的政策和政治沟通策略。
然而,该研究也存在一定局限性。比如,个体对意识形态量表的理解可能存在差异,同一人在不同时期也可能因个人、社会经济或政治环境变化而有不同解读;研究仅关注单一维度的意识形态量表,可能简化了复杂的意识形态立场;未回答意识形态问题的样本被排除,可能引入偏差。但这些局限性也为后续研究指明了方向,未来研究可针对这些问题进一步完善,提高 SCID 的稳健性和适用性,让这一数据库在社会政治研究领域发挥更大的价值。