基于蚁群优化算法开发儿童考试焦虑量表简版及超简版的心理测量学评价

《Cambridge Prisms: Global Mental Health》：Development of Short (CTAS-S) and Very Short (CTAS-VS) Form of Children’s Test Anxiety Scale Using Ant Colony Optimization

【字体：大中小】 时间：2025年12月27日 来源：Cambridge Prisms: Global Mental Health

编辑推荐：

　　本研究针对儿童考试焦虑(Test Anxiety)评估工具冗长的问题，利用蚁群优化(Ant Colony Optimization, ACO)算法开发了儿童考试焦虑量表(CTAS)的14题简版(CTAS-S)和3题超简版(CTAS-VS)。研究通过对土耳其570名和825名中学生样本的验证性因子分析(CFA)和测量等值性(Measurement Invariance)检验，证实两个简版量表均保持了原量表的因子结构（思维、任务外行为和自主反应）和良好的心理测量学特性（CFI>0.99，RMSEA<0.05），为儿童情绪过程的快速有效评估提供了实用工具。

在当今教育体系中，考试已成为评估学生学业成就不可或缺的一环。无论是国家层面的统一考试，还是国际性的学术评估（如PISA），考试不仅衡量着个体的学习成果，也检验着教育系统的有效性。然而，这些高风险的评估过程，尤其是对低龄学生而言，往往伴随着巨大的心理压力。学生们在备考和应考过程中，因高绩效期望、失败恐惧以及社会比较等因素，容易经历强烈的应激反应，进而引发一种常见的心理现象——考试焦虑（Test Anxiety）。研究表明，高水平的考试焦虑与较低的学习和考试表现显著相关，若在童年期未得到有效干预，这种焦虑可能延续至青少年甚至成年期，对学生的学业和心理社会发展产生持久负面影响。

考试焦虑作为一种复杂的多维结构，其定义随着理论研究的发展而不断演变。早期学者（如Mandler & Sarason, 1952）将其定义为考试前后体验到的紧张情绪。Liebert 和 Morris (1967) 进一步提出，考试焦虑包含“担忧”（Worry，指对考试结果的负面认知）和“情绪性”（Emotionality，指生理反应）两个核心成分。后续研究（如Wren & Benson, 2004）在此基础上增加了“任务外行为”（Off-Task Behaviors，如考试时分心、小动作等）这一行为维度，形成了认知、情感和行为的三维理论框架。为了科学评估儿童的考试焦虑水平，Wren和Benson（2004）开发了包含30个条目、三个维度（思维，13题；任务外行为，8题；自主反应，9题）的儿童考试焦虑量表（Children’s Test Anxiety Scale, CTAS）。该量表因其良好的心理测量学特性，在全球多个国家（如土耳其、埃及、阿根廷、伊朗等）得到广泛应用和改编，并被元分析研究确认为评估5-12岁儿童考试焦虑最常用的工具。

然而，在实际研究和应用场景（如多变量研究、大规模筛查、临床快速评估）中，冗长的原始量表面临着挑战。儿童注意力持续时间有限，长问卷易导致疲劳，影响数据质量；时间紧迫的教育环境也迫切需要更简短、易施测且信效度俱佳的工具。传统的量表简版开发方法往往难以在保留心理测量学质量和减少题目数量之间取得最佳平衡。近年来，元启发式算法（Meta-heuristic Algorithms）在心理测量学领域的应用为量表简版开发提供了新思路。其中，蚁群优化（Ant Colony Optimization, ACO）算法模拟蚂蚁觅食行为，通过“信息素”累积机制，在庞大的题目组合空间中高效搜寻能同时优化模型拟合度、内部一致性、因子结构和内容效度等多个指标的最佳题目组合，从而生成更科学、更平衡的简版量表。

在此背景下，土耳其Ondokuz Mayis大学的Selda Ors Ozdil、Akdeniz大学的Hakan Kogar和Bakent大学的Esra Kinay Cicek三位研究人员在《Cambridge Prisms: Global Mental Health》上发表了他们的研究成果。该研究旨在运用ACO算法，系统开发CTAS的简版（CTAS-S）和超简版（CTAS-VS），并严格检验其在不同样本中的信度和效度证据，为研究者和实践者提供灵活、高效的评估工具。

本研究主要采用了心理测量学中量表开发与验证的一系列关键技术方法。研究设计包含三个子研究，共涉及两个独立样本（样本1，N=570；样本2，N=825）。核心方法是蚁群优化（ACO）算法，通过R语言中的ShortForm包实现，参数设置为：收敛步数20、蒸发率0.9、蚂蚁数量20、无改进最大步数1000。效度检验包括：使用验证性因子分析（CFA）评估结构效度，指标包括CFI、TLI、RMSEA、SRMR；汇聚效度通过计算CTAS-S与儿童感知学业自我效能量表（CPSE）得分的皮尔逊相关系数进行评估；测量等值性（Measurement Invariance）分析则检验了量表在不同性别群体间的跨组不变性（Configural, Metric, Scalar, Strict Invariance），判断标准为ΔCFI<0.010, ΔTLI<0.010, ΔRMSEA<0.015。信度分析计算了序数α系数（Ordinal Alpha）、分层ω系数（Hierarchical Omega, ω）和平均变异抽取量（Average Variance Extracted, AVE）。内容效度通过Lawshe法计算内容效度比（CVR）和内容效度指数（CVI）进行评估。

研究结果

样本1的发现：CTAS-S的初步开发与验证

对样本1（N=570）的30题原始CTAS进行验证性因子分析（CFA）后，应用ACO算法进行题目筛选。算法在保留原三因子结构的前提下，从30个条目中选出14个条目（思维6题，任务外行为4题，自主反应4题）构成简版CTAS-S。分析结果显示，CTAS-S的模型拟合指数（χ2/df, CFI, TLI, RMSEA, SRMR）均优于原始长量表，达到了完美拟合标准（例如，CFI=.998, TLI=.998, RMSEA=.021）。信度方面，思维和自主反应两个维度的因子载荷（λ介于0.451-0.823之间）、序数α系数（分别为0.822和0.803）、ω系数（分别为0.798和0.762）和AVE值（分别为0.460和0.516）均达到可接受水平。然而，任务外行为维度的各项指标（因子载荷0.449-0.474，α=0.515，ω=0.467，AVE=0.212）均显示其内部一致性和聚敛效度较弱，这与该维度在原始量表及其他跨文化改编研究中表现出的特性一致。效标效度分析显示，CTAS-S各因子与儿童感知学业自我效能量表（CPSE）各因子得分呈负相关（r介于-0.070至-0.265之间），为区分效度提供了证据。

样本2的发现：CTAS-S的复核效度、测量等值性及CTAS-VS的开发

对样本2a（N=413）的CFA分析再次证实了CTAS-S优异的模型拟合度（CFI=.991, TLI=.989, RMSEA=.040）。思维和自主反应维度的信效度指标与样本1结果相似，而任务外行为维度的信度依然偏低（α=0.313, ω=0.263, AVE=0.112）。内容效度分析显示，14个条目的CVR值在0.78-1.00之间，总CVI值为0.87，表明简版量表内容效度良好。测量等值性分析结果表明，CTAS-S在性别间达到了严格等值（Strict Invariance），这意味着量表在不同性别群体中具有相同的因子结构、因子载荷、条目阈值和残差方差，所得分数差异可归因于真实的群体差异，而非测量偏差。

对样本2b（N=412）应用ACO算法，从CTAS-S的14个条目中进一步筛选出3个条目（分别来自三个维度：I21-思维，I26-任务外行为，I2-自主反应），构成单维度的超简版CTAS-VS。由于其条目数极少，模型恰好识别（饱和模型），拟合指数完美（CFI=1.000, RMSEA=.000）。其因子载荷（0.487-0.650）、ω系数（0.532）和序数α系数（0.591）在考虑到其极简设计的前提下被认为是可接受的。相关性分析显示，CTAS-VS总分与原始CTAS各因子得分（r=0.51-0.66）及CTAS-S各因子得分（r=0.54-0.68）均呈中高度显著相关，表明这个3条目版本能有效反映整体的考试焦虑水平。

讨论与结论

本研究成功运用ACO算法开发了CTAS的14题简版（CTAS-S）和3题超简版（CTAS-VS）。跨样本的研究结果一致表明，两个简版量表均具有良好的心理测量学特性。CTAS-S完美复制了原始量表的三因子结构，且模型拟合优度优于长版本。尽管行为维度（任务外行为）在所有研究中均表现出较低的内部一致性信度，这与该维度在原始量表及其他文化背景下的研究结果一致，但研究者基于理论考量（该维度捕捉了考试焦虑可观察的行为表现，是理论框架不可或缺的部分）和整体模型优越的拟合指数，决定在简版中予以保留。CTAS-VS作为单维度全局筛查工具，其心理测量学指标在超短量表的预期范围内是足够的，并且与长短版本得分高度相关，证明了其有效性。

研究的优势包括使用ACO这一先进的优化算法、大样本量、独立样本的交叉验证、以及进行了全面的测量等值性分析。然而，研究也存在一些局限性，例如样本均来自土耳其特定地区的初中生，可能限制结果的普适性；研究为横断面设计，未能提供量表的再测信度证据；样本2a和2b来自同一次调查的数据拆分，而非独立样本。未来研究需要在更广泛、更多样的群体（如不同年龄、文化背景、有特殊教育需求的儿童）中进一步验证量表的效度，并开展纵向研究考察其稳定性和预测效度。

总之，CTAS-S和CTAS-VS为评估儿童考试焦虑提供了高效、可靠的替代工具。CTAS-S适用于需要详细考察焦虑不同维度的研究或临床评估，而CTAS-VS则适用于时间紧迫的大规模筛查或快速评估。这两个简版工具的开发，平衡了评估的深度与效率，有望在儿童心理健康研究与实践领域发挥重要作用。

热点排行

新闻专题