综述：关于使用Cronbach's Alpha和McDonald’s Omega进行内部一致性评估的教程

首页今日动态人才市场新技术专栏中国科学人云展台
BioHot
云讲堂直播会展中心特价专栏技术快讯免费试用

生物通官微
陪你抓住生命科技
跳动的脉搏

生物通首页 > 今日动态 > 正文

《Perioperative Care and Operating Room Management》：Tutorial on Internal Consistency Assessment by Cronbach's Alpha and McDonald’s Omega

【字体：大中小】 时间：2025年10月23日 来源：Perioperative Care and Operating Room Management 1

编辑推荐：

　　可靠性分析中内部一致性测量方法比较及软件实现指南。该研究系统综述了六种核心模型：Cronbach's alpha、KR-20、Guttman's lambda-2、平行与严格平行方法、McDonald's omega，并详细阐述其理论假设、应用场景及在SPSS、R、STATA中的操作流程，特别强调Omega在异质项分析中的优势。

法尔赞·马达迪扎德（Farzan Madadizadeh）| 萨贾德·巴哈里尼亚（Sajjad Bahariniya）

伊朗亚兹德沙希德·萨杜吉医科大学（Shahid Sadoughi University of Medical Sciences）公共卫生学院，生物统计学与流行病学系，医疗数据建模中心

摘要

本教程全面介绍了可靠性分析中使用的内部一致性度量方法，重点介绍了六种主要模型：Cronbach's alpha、Kuder-Richardson方法（KR-20和KR-21）、Guttman's lambda-2、平行方法（Parallel Method）和严格平行方法（Strict Parallel Method），以及McDonald's omega系数。这些方法主要适用于社会科学、行为科学和教育科学中常用的心理测量工具和基于问卷的数据。内部一致性对于评估这些领域测量工具的可靠性至关重要。本文详细介绍了每种方法的理论基础、假设及实际应用，并提供了在SPSS、R和STATA软件中实现这些方法的指南。特别强调了McDonald's omega相对于Cronbach's alpha在提供更准确可靠性估计方面的优势。本研究的目的是通过提供全面的比较分析和实用指导，填补现有文献的空白，帮助研究人员有效测量内部一致性。

引言

可靠性分析有助于研究测量工具及其组成项目的特性¹。可靠性分析程序可以计算多种常用的测量工具可靠性指标，并提供关于工具内各项目之间关系的信息²。类内相关系数可用于计算评分者间的一致性估计³。内部一致性是衡量可靠性的一个指标⁴。可靠性指的是在其他条件相同的情况下，每次测量所得结果的一致性程度⁵。它评估的是用于测量同一构念的多个项目之间的相关性。在统计学和研究中，内部一致性通常是基于同一测试（或更大测试中的同一子测试）内不同项目之间的相关性来计算的⁶。这种方法无需重复测试或引入其他研究人员即可得出结果，因此当仅有一组数据时，它是评估可靠性的有效方法⁷。在围手术期护理和手术室管理中，可靠的测量工具对于评估临床方案、员工表现和患者报告的结果至关重要⁸^,⁹。Cronbach’s Alpha和McDonald’s Omega是两种广泛使用的可靠性系数，有助于确保这些高风险环境中使用的量表和问卷的一致性¹⁰。虽然Cronbach’s Alpha因其简单性而更受欢迎，但在项目对构念的贡献不同时，McDonald’s Omega提供了更稳健的替代方案——这在多学科的围手术期环境中尤为重要¹¹。本教程旨在指导研究人员和从业者正确选择和应用这些方法，以提高外科和围手术期研究的有效性和可靠性。据我们所知，虽然有一些教程介绍了某些内部一致性度量方法，但尚未有综合性教程全面回顾所有这些方法，并提供SPSS、R和STATA等软件的实现指南。本研究是首个全面比较所有这些统计度量方法的教程，并提供了相应的软件使用指南。

小节内容

Kuder-Richardson 20（KR-20）

Kuder-Richardson方法由两位美国心理学家Kuder和Richardson于1937年提出。该指数属于内部一致性指标之一。众所周知，KR-20和alpha系数实际上是相同的；不过，当用于二分评分项目时使用KR-20，而用于多分评分项目时使用alpha¹²。Alpha是Kuder-Richardson等价系数的一种推广形式。

Kuder-Richardson 20（KR-20）与Cronbach’s alpha（α）、人员分离可靠性（R）的比较

• KR20和α是经典测试理论中常用的度量指标，而R则源于现代测试理论，更具体地说，源于Rasch测量理论。这三个指标都将观察到的方差表示为真实方差和误差方差之和。

•
然而，它们在获取这些数值的方式上存在差异。KR20使用样本中“平均”受访者的误差方差，这可能会高估高分或低分受访者的误差方差；而R则使用实际误差方差。

手动计算和软件验证示例数据

假设有一个包含5名受访者、6个项目的量表，假设这些是测试答案（1=正确，0=错误）。

表1

重要说明：仅出于说明目的提供了N=5的小样本手动计算示例。在实际应用中，如此小的样本量会导致不可靠的估计结果。这些示例展示了关键概念的计算方法，但在实际操作中需要使用统计软件来获得McDonald’s Omega、GLB和模型拟合指数等系数的准确值。

结论

在评估内部一致性时，Cronbach’s Alpha通常用于连续型或李克特量表（Likert-type scales）。相比之下，KR-20和KR-21适用于二分评分项目，其中KR-21要求项目难度均匀。当因子载荷不同时，McDonald’s Omega更为适用，因为它能在同类模型中提供更精确的估计结果。Guttman’s Lambda-2和Split-Half可靠性方法可作为探索性工具使用，尽管它们的稳健性不如Alpha或Omega。

作者贡献

F.M.负责概念构思、项目管理工作、初稿撰写、审稿和编辑。S.B.参与初稿撰写、审稿和编辑工作。

伦理审批

本研究属于教程性质，无需伦理审批。

资金来源

作者未从任何学术或非学术机构获得资金支持。

数据和材料的可用性

不适用

人类伦理与参与同意声明

不适用

CRediT作者贡献声明

法尔赞·马达迪扎德（Farzan Madadizadeh）：负责初稿撰写、监督、资源准备、方法论设计、数据收集及概念构建。 萨贾德·巴哈里尼亚（Sajjad Bahariniya）：参与审稿与编辑工作、初稿撰写、监督、软件使用指导、资源协调、方法论完善及数据分析。

利益冲突声明

作者声明没有已知的财务利益冲突或个人关系可能影响本文的研究结果。

联系信箱：

粤ICP备09063491号

摘要

引言

小节内容

Kuder-Richardson 20（KR-20）

Kuder-Richardson 20（KR-20）与Cronbach’s alpha（α）、人员分离可靠性（R）的比较

手动计算和软件验证示例数据

结论

伦理审批

热点排行