RWI-UNI-SUBJECTS:德国高等教育学科布局演变数据集(1971–1996)及其对创新与区域发展的启示

【字体: 时间:2025年10月10日 来源:Scientific Data 6.9

编辑推荐:

  为填补高等教育学科动态演化数据的空白,研究团队基于德国联邦就业局年度《学习与职业选择》指南,利用计算机视觉算法构建了RWI-UNI-SUBJECTS数据集。该数据集涵盖1971–1996年间105,307个德国高校专业设置信息,并融合Destatis行政编码与ISCED-F国际分类,支持与NEPS、SOEP等面板数据联动分析,为教育政策、区域经济与创新研究提供了重要基础。

  
高等教育体系作为塑造人力资本、推动技术进步与经济增长的核心动力,其动态演变长期以来缺乏系统性的数据支撑。尤其在德国,20世纪70年代至90年代是高等教育大规模扩张的关键时期:大量新高校建立,计算机科学等新兴学科涌现,婴儿潮一代涌入校园。然而,尽管这一时期的教育变革深刻影响了社会结构与经济发展,却始终缺乏能够系统记录学科与机构分布时空演化的高质量数据集。
为此,由杜塞尔多夫大学与莱布尼茨经济研究所(RWI)领衔的研究团队,在《Scientific Data》上发布了首个覆盖德国全境高等教育机构学科分布的历史数据集——RWI-UNI-SUBJECTS。该数据集填补了国际高等教育实证研究的重要空白,为跨学科分析教育供给、区域创新与劳动力市场演变提供了前所未有的资源。
研究团队采用三阶段流程构建数据集。首先,对德国联邦就业局1971–1996年间每年发布的《学习与职业选择》指南进行全文扫描;其次,基于OpenCV库开发定制化的计算机视觉算法,通过线检测与模板匹配自动提取学科-机构表格中的图标数据;最后,对提取结果进行行政编码融合与术语统一,包括机构代码(Destatis)、学科分类代码(Destatis Subject Group/Area/Subject)、地区编码(BKG_municipality_code)以及国际教育分类ISCED-F映射,并借助MarianMT模型进行学科名称的机器翻译与术语对齐。

数据来源与提取验证

原始数据来自德国联邦就业局出版的权威指南,其在教育规划和职业咨询中具有法定垄断地位。数据编制由教育规划与研究促进委员会(BLK)统一协调,保证了跨年份、跨地区的一致性与可比性。研究团队通过可视化中间结果与随机抽样验证提取质量,估计平均错误率仅为0.2%。

数据覆盖与内容结构

数据集共包含105,307条专业记录,涵盖大学与应用科学大学的全日制、非全日制、限制录取等多种学习类型(study_type)。通过附加行政编码,该数据可与社会保险数据、官方教育统计、NEPS(国家教育面板研究)、SOEP(社会经济面板)等广泛链接。

学科扩散与区域不平衡

以计算机科学为例,该学科在1971年仅集中于少数通勤区,至1996年已显著扩张,但区域间仍存在明显差异,西北地区多数至80年代后才开设相关专业,而部分区域至1996年仍缺乏该学科供应。这一发现凸显了数据集在分析学科扩散时空路径与区域不平等方面的价值。

高校扩张与教育可及性

数据显示德国高校在1970年代与1990年代初经历两轮显著扩张,反映了政府扩大高等教育覆盖的努力。数据集已用于研究新大学建立对地方教育选择的影响,证实其能有效支持政策评估与区域发展分析。

数据整合与国际可比性

通过Destatis与ISCED-F的双重编码,数据集既保持国内统计兼容性,也支持国际比较。尽管存在少量匹配缺失(如1.49%的学科无法映射至Destatis_subject),绝大多数记录已完成标准化处理,具备较高可用性。
RWI-UNI-SUBJECTS数据集的发布为长期追踪高等教育结构变化、学科创新与区域发展互动提供了关键基础设施。其覆盖德国教育扩张的黄金时期,填补了国际学界在中观层面教育供给数据上的空白。通过高效链接行政与调查数据,该资源不仅支持教育政策评估、区域经济分析和技术扩散研究,也为探究学科结构如何响应劳动力市场需求与技术革命提供历史视角。尽管数据截至1996年,其标准化分类与丰富维度仍使其成为理解当代教育系统形成与演变的重要基石。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号