基于遗传算法(Genetic Algorithm, GA)优化的多层感知器神经网络(Multi-Layer Perceptron Neural Network, MLPNN)分析生成式人工智能工具对学业成绩的影响——案例研究
《Big Data and Cognitive Computing》:A Genetic Algorithm-Optimized MLPNN to Analyze the Impact of Generative Artificial Intelligence Tools on Academic Performance—A Case Study
编辑推荐:
摘要:近期对话式人工智能(Artificial Intelligence, AI)代理的出现深刻改变了高等教育的教与学实践,此类工具在提供认知辅助、增强学生自主性与效率方面具多重优势,但其对学业成绩(Actademic Performance)的实际影响尚缺乏
摘要:近期对话式人工智能(Artificial Intelligence, AI)代理的出现深刻改变了高等教育的教与学实践,此类工具在提供认知辅助、增强学生自主性与效率方面具多重优势,但其对学业成绩(Actademic Performance)的实际影响尚缺乏充分研究,现有研究结论常相互矛盾。为解决该问题,本研究首次采用遗传算法(Genetic Algorithm, GA)与多层感知器神经网络(Multi-Layer Perceptron Neural Networks, MLPNNs)评估生成式人工智能工具(Generative AI Tools, GAITs)对学生学业成果的影响。研究人员对摩洛哥三所工程学院294名学生开展结构化问卷调查收集GAITs使用数据;初步采用统计方法预测成绩发现,GAITs熟悉度对学业成绩有正向贡献但预测准确率仅39%,表明需更稳健方法。因此研究人员开发基于GA优化超参数的MLPNN混合模型,以更好捕捉解释变量与学业成绩间的复杂关系。结果表明,本研究纳入的GAITs相关变量单独对学业成绩预测能力有限,说明现有数据未能全面涵盖GAITs使用背景下学业成功影响因素的复杂性。
论文解读:《A Genetic Algorithm-Optimized MLPNN to Analyze the Impact of Generative Artificial Intelligence Tools on Academic Performance—A Case Study》发表于《Big Data and Cognitive Computing》
一、研究背景与立题依据
随着大语言模型等生成式人工智能工具(Generative AI Tools, GAITs)在教育领域普及,现有研究对其学业影响结论矛盾:部分认为可提升动机与效率,部分指出过度使用削弱深度知识习得与批判性思维。传统统计方法假设变量间线性关系,难以刻画GAITs使用行为、个体学习习惯与学术情境间的非线性交互。多层感知器神经网络(Multi-Layer Perceptron Neural Network, MLPNN)可建模非线性关系,但其性能高度依赖超参数(学习率、隐层神经元数、权重初始值等)配置;遗传算法(Genetic Algorithm, GA)受自然选择启发可在解空间全局寻优,适合优化MLPNN超参数。目前尚无研究将GA优化MLPNN用于GAITs对学业成绩影响的分析,此为本文研究缺口。研究人员以摩洛哥三所工程学院学生为对象,结合传统统计分析与GA-MLPNN混合模型,探究GAITs使用各维度(熟悉度Familiarity、使用频率Frequency、使用时长Duration、依赖程度Doing)与学期末学业成绩(Note, 0–4有序标度)的关系及预测效能。
二、主要关键技术方法
研究人员采用横断面调查设计,选取摩洛哥ENSI Tanger、ENSA Tetouan、EST Fez三所院校2024/2025学年工科生,经筛选获有效问卷294份(n=294),Cochran公式验证样本量满足95%置信水平、5%误差要求。问卷含人口学信息与GAITs四维度李克特式量表,Cronbach's α=0.68,所有题项强制作答并编码为0–4有序尺度,无缺失值。统计分析先进行多重共线性检验(皮尔逊相关、方差膨胀因子Variance Inflation Factor, VIF)、序数逻辑回归(Ordinal Logistic Regression)与混淆矩阵评估;继而构建MLPNN(输入层4神经元–单隐层10神经元(sigmoid激活)–输出层1神经元(双极sigmoid激活,输出重缩放至0–4)),以GA优化网络权重、偏置与学习率η:种群规模50、实数编码染色体、算术交叉与变异、精英保留(elitism, k为种群比例)、适应度函数为训练集均方根误差(Root Mean Square Error, RMSE),迭代1000代作为终止准则,独立重复50次取最优配置。数据集按70%训练/30%测试划分,以RMSE、准确率(Accuracy)、精确率(Precision)、召回率(Recall)、F1值、受试者工作特征曲线下面积(Area Under the ROC Curve, AUC-ROC)及混淆矩阵评估模型,并与未优化MLPNN、支持向量机(Support Vector Machine, SVM)、随机森林(Random Forest, RF)对比。
三、研究结果
4. Results and Discussion
经相关矩阵与VIF检验(VIF 1.22–1.42 < 5,Pearson系数 < 0.5),自变量间无显著多重共线性,全数保留入模。序数回归显示仅Familiarity估计值0.5579(p=2.86×10?5< 0.05)对Note有显著正向影响,Frequency、Duration、Doing p > 0.1143不显著;混淆矩阵得序数回归分类准确率39.8%,证实GAITs四变量单独解释力低。
GA-MLPNN测试集RMSE=0.903,低于未优化MLPNN(0.950)、SVM(0.918)、RF(0.921)。二分类视角(Note≥3为正类)混淆矩阵示:真负(True Negative, TN)=58,真正(True Positive, TP)=2,假正(False Positive, FP)=0,假负(False Negative, FN)=29;Precision=1.000,特异度(Specificity)=1.000,Recall=0.064,F1-score=0.121,AUC-ROC=0.759。RF的AUC-ROC略高(0.784)但TP=0致Recall与F1-score为0;唯GA-MLPNN能识别少量正类且RMSE最低,说明GA优化提升MLPNN拟合能力但仍受限于输入变量集局限。研究人员指出学业成绩同时受教育史、动机、社会经济地位、家庭支持、院校环境等多维因素影响,仅GAITs四维度不足以充分预测。
四、讨论与结论翻译
结论:本研究以摩洛哥三所工程学院学生为样本探讨GAITs使用对学业成绩之影响。传统统计显示GAITs相关变量单独预测力有限,故构建GA优化MLPNN混合模型。GA-MLPNN测试集RMSE=0.903,较未优化MLPNN(0.950)、SVM(0.918)、RF(0.921)更低;准确率67.4%、精确率1.000、F1-score 0.121、AUC-ROC 0.759,虽召回率低仅识别少数优绩生,但相较基准模型有所改善。研究表明本研究所涉GAITs变量孤立情况下对学业成绩预测能力有限,不支持GAITs必然有益或有害的简化观点。理论层面融合传统统计与神经网络法丰富教育领域生成式AI文献;实践层面为教育者及政策制定者合理融入GAITs、制定学术诚信指南及调整考核方式(强调批判性思维与项目制学习)提供参考;社会层面揭示摩洛哥高教中AI工具接入与熟悉度差异可能引致数字鸿沟。局限含样本仅294人工科生来自三校、自报告偏差、未纳入其他协变量、横断面设计无法确立因果;未来宜扩大多学科多区域样本、增补解释变量并采用纵向设计。