心理学可重复性危机的新视角：统计软件选择对因子分析结果的影响

首页今日动态人才市场新技术专栏中国科学人云展台
BioHot
云讲堂直播会展中心特价专栏技术快讯免费试用

生物通官微
陪你抓住生命科技
跳动的脉搏

生物通首页 > 今日动态 > 正文

【字体：大中小】 时间：2025年06月06日 来源：Journal of School Psychology 3.8

编辑推荐：

　　本研究针对心理学领域长期存在的可重复性危机，首次系统探讨了统计软件选择对因子分析（Factor Analysis）结果的潜在影响。通过对WISC-V和MEZURE两种认知能力测试工具进行探索性因子分析（EFA），采用SPSS、R/psych等四种统计软件对比发现，即使使用相同数据和主轴因子提取法（PAF）结合Promax旋转等标准化流程，不同软件仍会产生显著差异的结构效度结果。这一发现为解释认知能力测验结构效度争议提供了方法论层面的新证据，强调多软件验证和代码透明化对心理学研究的重要性。

心理学研究正面临严峻的可重复性危机，大量研究结果无法被独立团队复现。这一现象在认知能力测验的结构效度验证中尤为突出——即使采用相同数据集和统计方法，不同研究者对WISC-V等主流量表的因子结构仍存在激烈争议。传统归因多聚焦于p值操纵（p-hacking）或数据透明度问题，但Stefan C. Dombrowski团队在《Journal of School Psychology》发表的研究揭示了一个长期被忽视的关键变量：统计软件的选择差异可能系统性影响因子分析结果。

为验证这一假设，研究者设计了一项精密的再现性实验。他们选取心理学界广泛使用的两种认知能力测验——韦氏儿童智力量表第五版（WISC-V）和MEZURE量表，采用完全相同的相关矩阵数据，在SPSS（26.0版）、R语言psych包（2023版）等四种主流统计软件中实施标准化分析流程：先进行主轴因子提取（Principal Axis Factoring, PAF）配合Promax斜交旋转，再应用Schmid-Leiman高阶因子转化程序。所有分析均严格控制算法参数一致性，确保方法层面的可比性。

Reproduction and replication: Distinctions with a difference
研究首先厘清了"再现性"（Reproduction）与"复现性"（Replication）的核心差异：前者要求使用原始数据和代码获得相同结果，后者则允许在新数据集中验证结论。本研究属于严格意义上的再现性研究，其结论对两类问题均具启示价值。

Reasons for the reproducibility crisis
系统梳理了导致心理学研究不可重复的八大因素，包括HARKing（结果后设假说）、统计功效不足等常见原因，同时首次将"统计软件算法差异"列为独立影响因素。

Results
数据分析显示惊人差异：不同软件生成的因子载荷矩阵存在系统性偏移，WISC-V的群体因子（Group Factor）载荷差异最高达0.32，MEZURE的共性度（Communality）估计值平均差异为0.18。R语言psych包与SPSS在Schmid-Leiman转换后的高阶因子结构呈现显著分歧。

Discussion
这些差异足以导致研究者对测验结构做出不同理论解释——例如某个子测验可能被归类到流体推理（Fluid Reasoning）或工作记忆（Working Memory）维度。研究强调，当前期刊要求作者仅报告统计方法名称（如"采用PAF分析"）远远不够，必须公开具体软件版本和代码。

Conclusion
该研究为心理学测量领域提供了三点关键启示：其一，因子分析结果应视为"软件依赖型"结论；其二，重要发现需经多软件平台交叉验证；其三，期刊应强制要求公开分析代码。这些措施对保障认知能力测验的结构效度评价客观性、缓解心理学可重复性危机具有深远意义。

热点排行

新闻专题

联系信箱：

粤ICP备09063491号