考古学是否是一门科学？基于万篇文献分析与可重复性评估的实证研究

首页今日动态人才市场新技术专栏中国科学人云展台
BioHot
云讲堂直播会展中心特价专栏技术快讯免费试用

生物通官微
陪你抓住生命科技
跳动的脉搏

生物通首页 > 今日动态 > 正文

【字体：大中小】 时间：2025年06月19日 来源：Journal of Archaeological Science 2.6

编辑推荐：

　　本文针对考古学长期存在的学科定位争议，通过创新性文献计量学方法分析近万篇文献，结合《Journal of Archaeological Science》年度可重复性评审数据，首次实证揭示了考古学在自然科学与社会科学间的独特定位。研究发现考古学在作者合作规模上接近自然科学，但在文献引用模式上更趋近社会科学，同时指出计算可重复性缺失（如数据缺失、依赖项未声明）是制约学科科学性的关键瓶颈。作者提出标准化项目组织、显性依赖文档等实操方案，为建立可重复性研究范式提供了转型路径，对提升考古学研究的科学严谨性与社会公信力具有里程碑意义。

考古学究竟属于自然科学还是社会科学？这个困扰学界半个多世纪的"身份危机"，直接影响了考古研究的范式选择与教育传承。从1968年Jacquetta Hawkes与Glynn Isaac的经典辩论开始，到Binford倡导的亨佩尔式(Hempel)科学模型，再到Hodder主张的后过程主义考古学，争论往往停留在哲学思辨层面。而随着数字技术席卷学术界，Bevan提出的"数据洪流重塑分析议程"观点，使得实证评估学科现状变得尤为迫切。

《Journal of Archaeological Science》的50周年特刊中，一项突破性研究通过定量分析给出了答案。研究者创新性地采用Biglan(1973)的硬科学(hard)/软科学(soft)框架，对Web of Science收录的9,000余篇考古学文献进行文献计量学(bibliometrics)分析，同时系统评估了该期刊2024年度计算考古学(computational archaeology)论文的可重复性(reproducibility)。这两项工作共同构成了迄今为止最全面的考古学科学性实证评估。

研究采用Fanelli和Gl?nzel(2013)开发的跨学科比较方法，重点考察了五项关键指标：作者数量、标题长度、参考文献时效性、参考文献多样性及图表复杂度。通过机器学习聚类分析，将考古学与物理学、化学等典型硬科学，以及经济学、心理学等软科学进行多维对比。为验证文献计量结果，研究者作为期刊首位"可重复性副主编"(AER)，对含编程代码(R/Python)的投稿实施了结构化评审，检查数据可获得性、代码可执行性及文档完整性等要素。

如何衡量科学的硬度？
通过主成分分析(PCA)发现，考古学在作者合作规模上(平均4.7人/篇)显著大于典型社会科学(3.2人)，但远低于物理学(9.1人)。标题长度指标显示考古学论文标题(12.3词)比化学(9.1词)更接近人类学(14.5词)。最具区分度的指标是参考文献时效性：考古学引用文献的中位年龄为8.2年，介于心理学(6.5年)与历史学(11.3年)之间。这些证据表明考古学呈现"混合型"学科特征。

可重复性：科学性的试金石
对12个月的可重复性评审显示，仅31%的投稿能完全复现结果。主要障碍包括：57%存在数据缺失，34%未声明软件依赖项(如R包版本)，22%使用非标准数据格式。典型案例中，某个贝叶斯年代模型因未提供JAGS脚本的初始值设置，导致结果偏差达±15%。这与Cleveland(1984)提出的"可视化规范反映学科共识度"理论高度吻合。

提升可重复性的实用方案
研究者提出"最小可行可重复性"方案：1)采用Cookiecutter模板规范项目目录结构；2)使用renv或conda冻结软件环境；3)在README.md中注明系统架构要求。对定性研究，建议采用Portable Antiquities Scheme式的标准化描述框架。这些措施在Abu Dhabi研讨会(2025)的测试中，使复现成功率提升至79%。

这项研究首次通过大数据揭示了考古学的跨学科特征，为持续百年的学科定位之争提供了实证答案。更重要的是，它建立了可重复性与科学共识度的量化关联，为Latour(1987)提出的"科学建构论"提供了新证据。正如研究者援引《格列佛游记》的隐喻所示：只有当考古学家停止"从黄瓜中提取阳光"式的孤立研究，转向可验证的合作范式，才能真正实现Isaac(1971)预言的"更精确、更生动的史前叙述"。论文建立的文献计量学框架，也为评估其他交叉学科的科学性提供了方法论模板。

热点排行

新闻专题

联系信箱：

粤ICP备09063491号