
-
生物通官微
陪你抓住生命科技
跳动的脉搏
测试准备是否中介父母教育水平对医学院入学考试表现的影响?一项潜在类别分析与测量不变性研究
【字体: 大 中 小 】 时间:2025年09月19日 来源:Intelligence 2.8
编辑推荐:
针对入学考试成绩与社会经济地位(SES)相关性争议,本研究通过潜在类别分析(LCA)和BCH-3步法中介分析,发现尽管测试准备能提高成绩(解释12.6-16.2%方差),但其使用与父母教育水平无显著关联,且SES相关差异完全由高阶特质差异解释,否定了测试准备的中介作用,对招生公平性评估具有重要理论意义。
医学院入学考试作为选拔未来医生的关键环节,其公平性一直备受关注。一个令人不安的现象是:考生的考试成绩往往与其父母的教育水平存在显著相关。这种相关性引发了公众对考试公平性的质疑——是否富裕家庭的孩子仅仅因为能够获得更优质的备考资源,就在竞争中占据了不公平优势?许多批评者认为,社会经济地位(SES)的差异可能导致接触不同质量和价格的备考课程与材料,而这些备考活动本身又能有效提升考试成绩,因此,备考情况很可能是解释SES与考试成绩之间关系的一个关键中介因素。然而,这一看似合理的假设在过去缺乏直接、严谨的实证检验。
为了填补这一研究空白,由Markus Sommer领衔的研究团队开展了一项大规模研究,他们利用奥地利三届医学院申请人(2019、2021、2022年 cohort)的数据,首次直接检验了“测试准备中介了父母教育水平对医学入学考试(MedAT)表现的影响”这一假设。他们的研究成果发表在权威期刊《Intelligence》上,为这场关于教育公平的讨论提供了坚实的数据支持和全新的理论视角。
研究团队采用了多种高级统计分析方法来确保结论的可靠性。首先,他们使用潜在类别分析(LCA)对考生采用的十四种备考活动(包括免费和商业性的课程、书籍、应用程序等)进行了分析,旨在识别出不同的备考模式群体,而非简单地将备考视为一个连续变量。其次,他们采用了BCH-3步法进行中介分析,这种方法能有效处理潜在类别作为中介变量时产生的分类误差,从而更准确地估计直接和间接效应。最后,他们通过多组测量不变性分析(Measurement Invariance Analysis)来检验不同群体(按备考情况或SES划分)的考试成绩差异在多大程度上反映了其底层高阶能力特质(如智力g、自然科学知识Gk-ns)的真实差异。所有分析均基于三个独立的大样本队列(总样本量超过4400人),确保了结果的可重复性和稳健性。
4.1. Results on individual differences in test preparation
通过潜在类别分析,研究人员在所有三个队列中均一致地识别出四个具有显著差异的备考类别:
LCA 1(广泛备考类):约占23-30%。该类考生投入大量时间和精力,广泛使用了8-9种免费和商业备考资源,包括官方样题、商业备考书籍、在线辅导课程和练习应用程序等,是备考最充分的群体。
LCA 2(商业为主辅以免费类):约占18-38%。该类考生平均使用4-5种备考方法,但侧重于商业在线课程、商业应用程序和商业书籍,并辅以一两种免费的备考资源(如学校书籍、大学样题)。
LCA 3(免费为主辅以商业书类):约占29-55%。该类考生同样使用4-5种备考方法,但以各种免费的备考资源为主,仅辅以商业备考书籍。在备考数量上与LCA 2无差异,但资源组合偏好不同。
LCA 4(无备考类):约占3-4%。该类考生未使用任何备考活动直接参加考试。
分类准确性指标(熵和平均潜在类别概率)表明四个类别得到了良好的区分。
4.3. Results on the mediating role of test preparation in the SES-achievement relation
中介分析的结果清晰且一致地否定了研究的核心假设:
备考与考试成绩相关:四个备考类别在考试成绩(智力分和自然科学知识分)上存在显著差异。广泛备考类(LCA 1)表现最佳,无备考类(LCA 4)表现最差。备考情况解释了考试成绩12.6%至16.2%的方差,这与以往关于备考效用的元分析结论一致。
备考与父母教育水平无关:关键发现是,考生所属的备考类别与其父母的教育水平没有显著统计关联。以无备考类为参照,父母教育水平并不能显著预测一个考生更可能属于其他三个备考类别中的任何一个。
中介效应不成立:由于中介路径的起点(父母教育水平 → 备考)不成立,所谓的间接效应(即中介效应)自然也不显著。分析显示,纯自然间接效应(PNIE)和总自然间接效应(TNIE)均不显著。然而,父母教育水平对考试成绩的直接效应虽然微弱(r = 0.080 – 0.140),但在统计上是显著的。
结论很明确:测试准备不能中介父母教育水平与入学考试成绩之间的关系。
4.4. Results on the generalizability of SES-related differences to higher-order traits
测量不变性分析为理解SES与考试成绩的微弱直接关系提供了更深层的解释:
跨SES的标量不变性成立:在不同父母教育水平的组别之间,标量测量不变性(Scalar Measurement Invariance) 成立。这意味着,SES群体在八个分测验上的成绩差异,可以完全由他们在两个高阶特质(智力g和自然科学知识Gk-ns)上的真实差异来解释。考试测量的是同一构念,且没有偏差。
跨备考类别的标量不变性不成立:在不同备考类别的组别之间,标量测量不变性被违反。这意味着,备考带来的分数增益并不能完全转化为高阶特质水平的提升,而是局限于对特定分测验所测量的更窄能力(narrower traits)的熟练度提升。这验证了“策略精炼假说(strategy refinement hypothesis)”。
研究的结论与讨论部分对结果进行了深入阐释。本研究直接检验并最终否定了“测试准备是SES与入学考试成绩关系的中介变量”这一流行假设。尽管备考本身能有效提升成绩,但其使用在现代考试情境下已与家庭社会经济背景脱钩,因此无法解释为何来自高教育水平家庭的考生表现更好。
那么,如何解释SES与考试成绩之间虽然微弱但显著的相关性呢?研究人员指出,测量不变性的结果支持了另一种理论解释:父母教育水平与子女考试成绩的关联,更可能是由于从婴儿期到成年期长期作用的机制所导致。这些机制包括:
基因的代际传递:智力具有较高的遗传性(h2),父母基因通过直接遗传和“遗传养育”(genetic nurture)效应,即父母基于自身基因型为孩子创造更优越的认知刺激环境,共同影响子女认知能力的发展。
非物质形式文化资本的代际传递:包括父母的教育期望、学业价值观、自我效能感等,这些因素影响子女的学业轨道选择(如是否选择学术导向的中学和大学),而不同的教育经历又会反过来促进认知能力和知识水平的增长。
这些长期效应最终在考生参加入学考试时,体现为他们在高阶认知特质(如智力、自然科学知识)上的真实差异。本研究的数据与这一观点高度吻合——SES差异完全体现在高阶特质上,而备考差异则不能。
本研究具有重要的理论与实践意义。在理论上,它挑战了一个广泛持有的、关于考试不公平根源的简化论观点,将讨论引向了对更深层、更长期的社会与生物心理过程的关注。在实践上,它表明近年来通过提供免费和低成本备考资源以促进教育公平的政策(如奥地利MedAT的做法)取得了显著成效,成功切断了备考机会与经济背景的联系,从而在一定程度上减少了考试分数中的社会经济差异。然而,要完全消除SES与学业成就之间的关联,可能需要更早期、更根本的干预措施,着眼于整个生命历程中的机会平等与发展支持。
生物通微信公众号
知名企业招聘