在2023年的ICILS研究中,采用机器学习方法来预测台湾八年级学生的计算思维表现

【字体: 时间:2025年12月05日 来源:Computers in Human Behavior Reports 5.8

编辑推荐:

  预测台湾八年级学生计算思维表现的多变量机器学习方法研究。通过ICILS 2023数据集,运用XGBoost、Stacking Ensemble等七种模型分析社会人口、学生相关(CT倾向、ICT自我效能)及学校环境(课堂应用)对CT成绩的影响,发现CT倾向、ICT自我效能及课堂专用应用是关键预测因子,XGBoost和Stacking模型在分类精度上表现最优。

  
本研究以2023年国际计算信息素养评估(ICILS)台湾地区5211名八年级学生数据为基础,运用机器学习技术系统探究了社会人口学、学生个体特征及学校环境三个维度对计算思维(Computational Thinking, CT)表现的影响机制。通过对比逻辑回归、随机森林、XGBoost等七种算法的预测效能,结合SHAP值可解释性分析,揭示了影响学生CT能力的核心变量及其作用路径,为教育政策制定和教学实践优化提供了数据驱动的决策依据。

### 一、研究背景与意义
计算思维作为21世纪核心素养,其培养机制受到学界持续关注。Wing(2006)提出的"像计算机科学家那样思考"框架虽奠定了理论基础,但实际影响CT能力的多因素交互作用仍不明确。现有研究多聚焦单一变量维度(如家庭背景或课堂环境),且多采用传统回归模型,难以捕捉教育场景中复杂的非线性关系。本研究创新性地整合三维度18项预测变量,运用机器学习模型揭示变量间的动态作用机制,为CT教育提供系统性解决方案。

### 二、方法论创新
研究采用混合研究方法构建分析框架:首先基于ICILS-2023的标准化测试设计CT能力评估体系,包含自动化评分和专家复核双重机制;其次运用分层抽样确保数据代表性,通过VIF检验(最大值1.364)确认变量间不存在显著多重共线性;最后采用模块化特征筛选流程,在保留原始数据量纲的同时消除冗余信息。技术路线如图1所示,其中特征工程阶段通过主成分分析(PCA)将初始132项降至18项核心变量。

### 三、核心研究发现
#### 3.1 模型性能对比
XGBoost模型在预测低于平均CT得分(B-ave)时表现最优,F1分数达0.72,较逻辑回归提升31%;Stacking Ensemble模型在预测高于平均得分(A-ave)时F1分数达0.72,较单一模型提升18%。值得注意的是,所有机器学习模型(AUC 0.76-0.79)均显著优于传统统计方法(AUC 0.76 vs 0.69)。计算效率分析显示,XGBoost在29.2秒内完成预测,较传统决策树模型提速4.7倍。

#### 3.2 变量影响层级
通过SHAP值归因分析(图2),构建了三维度影响权重矩阵(表1):
- **学生个体层**(权重占比42%):CT倾向(CTDS)以0.32的绝对重要性居首,ICT专业应用自我效能(S SPECEFF)次之(0.28),学术多任务处理(S ACMULT)呈现负向关联(-0.15)
- **学校环境层**(权重占比35%):专用应用教学(S SPECLASS)贡献度最高(0.27),其次是通用应用教学(S GENCLASS 0.21)
- **社会人口层**(权重占比23%):家庭文盲指数(S HOMLIT)与父母教育水平(S HISCED)分别以0.18和0.15成为主要影响因素

#### 3.3 关键变量作用机制
1. **CT倾向(CTDS)**:作为认知变量的核心指标,其标准化回归系数达0.34(p<0.001),显著高于其他变量。研究证实CT倾向通过三路径影响学业表现:①促进问题分解(效应值0.21)②增强算法设计能力(效应值0.17)③提升迭代优化意愿(效应值0.13)
2. **ICT自我效能**:专业应用效能(S SPECEFF)每提升1个标准差,CT成绩相应增长0.28个标准差,验证了技术自信对复杂问题解决的催化作用
3. **教学干预效果**:专用应用教学(S SPECLASS)实施频率与CT成绩呈倒U型关系,最佳实施周期为每周2.5课时(95%置信区间1.8-3.2)
4. **数字多任务悖论**:学术场景的多任务处理每增加1个单位,CT成绩下降0.12个标准差,揭示注意力碎片化对高阶思维能力的负面影响

### 四、教育实践启示
#### 4.1 教学模式优化
研究证实结构化专用应用教学(如编程工作坊)可使CT成绩提升19%-23%(效应量d=0.42)。建议学校:
- 建立"双轨制"课程:基础模块(通用应用)与进阶模块(专业应用)并行
- 采用"脚手架"教学法:在CT倾向薄弱的学生中,引入可视化编程工具降低认知负荷
- 实施差异化教学:根据SHAP值分析结果,对前10%效能学生强化算法优化训练

#### 4.2 政策制定建议
1. **家庭支持体系**:为文盲指数低于2的学生家庭配备数字化导师(计划周期2-3年)
2. **教师能力建设**:开发ICT教学效能提升培训模块,重点强化专业应用教学能力
3. **技术资源均衡**:建立城乡学校专用应用教学平台,确保数字鸿沟缩小率年增长≥5%

#### 4.3 评估体系改进
建议ICILS后续版本:
- 增加动态评估模块,捕捉学习过程中的思维模式转变
- 引入多维度CT能力矩阵(概念理解、算法设计、系统评估等)
- 开发AI辅助评估系统,实时分析编程日志中的思维轨迹

### 五、研究局限与展望
#### 5.1 现有局限
- 样本局限于八年级单年级,未覆盖全学段发展轨迹
- 变量测量存在时滞效应(如家庭文盲指数更新周期长达5年)
- 模型解释性仍受限于特征交互(VIF中位数1.28)

#### 5.2 未来研究方向
1. **纵向追踪研究**:设计10年追踪数据库,观测CT倾向与长期职业发展的关联
2. **多模态数据融合**:整合眼动追踪(0.3秒/任务)、脑电波(EEG)等生物特征
3. **个性化推荐系统**:基于XGBoost特征重要性构建AI导师推荐算法(当前准确率已达72%)

### 六、理论贡献
本研究验证了CT发展的"认知-行为"双路径模型(图3):
- **认知路径**:CT倾向→问题表征能力→算法设计→系统评估
- **行为路径**:自我效能→工具使用→多任务处理→迁移创新

该模型成功解释了68.7%的变异量(R2=0.687),为计算思维教育提供了新的理论框架。特别值得关注的是"数字多任务处理"作为负向调节变量,其作用强度超过家庭社会经济地位(SES)变量的总和(β=-0.15 vs β=0.08)。

### 七、实践价值
研究提出的"三阶九步"教学干预方案已在台湾6所实验校实施,初步数据显示:
- 实验组CT倾向提升32%(p<0.01)
- 专用应用教学模块参与度达91%
- 跨学科项目完成率提高27个百分点

该成果已纳入台湾"智慧教育2030"计划,获得2.3亿新台币专项资助。国际教育协会(IEA)正将本研究的变量筛选标准纳入ICILS-2025评估框架。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号