
-
生物通官微
陪你抓住生命科技
跳动的脉搏
考古学是否是一门科学?基于万篇文献分析与可重复性评估的实证研究
【字体: 大 中 小 】 时间:2025年06月19日 来源:Journal of Archaeological Science 2.6
编辑推荐:
本文针对考古学长期存在的学科定位争议,通过创新性文献计量学方法分析近万篇文献,结合《Journal of Archaeological Science》年度可重复性评审数据,首次实证揭示了考古学在自然科学与社会科学间的独特定位。研究发现考古学在作者合作规模上接近自然科学,但在文献引用模式上更趋近社会科学,同时指出计算可重复性缺失(如数据缺失、依赖项未声明)是制约学科科学性的关键瓶颈。作者提出标准化项目组织、显性依赖文档等实操方案,为建立可重复性研究范式提供了转型路径,对提升考古学研究的科学严谨性与社会公信力具有里程碑意义。
考古学究竟属于自然科学还是社会科学?这个困扰学界半个多世纪的"身份危机",直接影响了考古研究的范式选择与教育传承。从1968年Jacquetta Hawkes与Glynn Isaac的经典辩论开始,到Binford倡导的亨佩尔式(Hempel)科学模型,再到Hodder主张的后过程主义考古学,争论往往停留在哲学思辨层面。而随着数字技术席卷学术界,Bevan提出的"数据洪流重塑分析议程"观点,使得实证评估学科现状变得尤为迫切。
《Journal of Archaeological Science》的50周年特刊中,一项突破性研究通过定量分析给出了答案。研究者创新性地采用Biglan(1973)的硬科学(hard)/软科学(soft)框架,对Web of Science收录的9,000余篇考古学文献进行文献计量学(bibliometrics)分析,同时系统评估了该期刊2024年度计算考古学(computational archaeology)论文的可重复性(reproducibility)。这两项工作共同构成了迄今为止最全面的考古学科学性实证评估。
研究采用Fanelli和Gl?nzel(2013)开发的跨学科比较方法,重点考察了五项关键指标:作者数量、标题长度、参考文献时效性、参考文献多样性及图表复杂度。通过机器学习聚类分析,将考古学与物理学、化学等典型硬科学,以及经济学、心理学等软科学进行多维对比。为验证文献计量结果,研究者作为期刊首位"可重复性副主编"(AER),对含编程代码(R/Python)的投稿实施了结构化评审,检查数据可获得性、代码可执行性及文档完整性等要素。
如何衡量科学的硬度?
通过主成分分析(PCA)发现,考古学在作者合作规模上(平均4.7人/篇)显著大于典型社会科学(3.2人),但远低于物理学(9.1人)。标题长度指标显示考古学论文标题(12.3词)比化学(9.1词)更接近人类学(14.5词)。最具区分度的指标是参考文献时效性:考古学引用文献的中位年龄为8.2年,介于心理学(6.5年)与历史学(11.3年)之间。这些证据表明考古学呈现"混合型"学科特征。
可重复性:科学性的试金石
对12个月的可重复性评审显示,仅31%的投稿能完全复现结果。主要障碍包括:57%存在数据缺失,34%未声明软件依赖项(如R包版本),22%使用非标准数据格式。典型案例中,某个贝叶斯年代模型因未提供JAGS脚本的初始值设置,导致结果偏差达±15%。这与Cleveland(1984)提出的"可视化规范反映学科共识度"理论高度吻合。
提升可重复性的实用方案
研究者提出"最小可行可重复性"方案:1)采用Cookiecutter模板规范项目目录结构;2)使用renv或conda冻结软件环境;3)在README.md中注明系统架构要求。对定性研究,建议采用Portable Antiquities Scheme式的标准化描述框架。这些措施在Abu Dhabi研讨会(2025)的测试中,使复现成功率提升至79%。
这项研究首次通过大数据揭示了考古学的跨学科特征,为持续百年的学科定位之争提供了实证答案。更重要的是,它建立了可重复性与科学共识度的量化关联,为Latour(1987)提出的"科学建构论"提供了新证据。正如研究者援引《格列佛游记》的隐喻所示:只有当考古学家停止"从黄瓜中提取阳光"式的孤立研究,转向可验证的合作范式,才能真正实现Isaac(1971)预言的"更精确、更生动的史前叙述"。论文建立的文献计量学框架,也为评估其他交叉学科的科学性提供了方法论模板。
生物通微信公众号
知名企业招聘