基于遗传算法(Genetic Algorithm, GA)优化的多层感知器神经网络(Multi-Layer Perceptron Neural Network, MLPNN)分析生成式人工智能工具对学业成绩的影响——案例研究

《Big Data and Cognitive Computing》：A Genetic Algorithm-Optimized MLPNN to Analyze the Impact of Generative Artificial Intelligence Tools on Academic Performance—A Case Study

【字体：大中小】 时间：2026年06月09日 来源：Big Data and Cognitive Computing 4.4

编辑推荐：

　　摘要：近期对话式人工智能(Artificial Intelligence, AI)代理的出现深刻改变了高等教育的教与学实践，此类工具在提供认知辅助、增强学生自主性与效率方面具多重优势，但其对学业成绩(Actademic Performance)的实际影响尚缺乏

摘要：近期对话式人工智能(Artificial Intelligence, AI)代理的出现深刻改变了高等教育的教与学实践，此类工具在提供认知辅助、增强学生自主性与效率方面具多重优势，但其对学业成绩(Actademic Performance)的实际影响尚缺乏充分研究，现有研究结论常相互矛盾。为解决该问题，本研究首次采用遗传算法(Genetic Algorithm, GA)与多层感知器神经网络(Multi-Layer Perceptron Neural Networks, MLPNNs)评估生成式人工智能工具(Generative AI Tools, GAITs)对学生学业成果的影响。研究人员对摩洛哥三所工程学院294名学生开展结构化问卷调查收集GAITs使用数据；初步采用统计方法预测成绩发现，GAITs熟悉度对学业成绩有正向贡献但预测准确率仅39%，表明需更稳健方法。因此研究人员开发基于GA优化超参数的MLPNN混合模型，以更好捕捉解释变量与学业成绩间的复杂关系。结果表明，本研究纳入的GAITs相关变量单独对学业成绩预测能力有限，说明现有数据未能全面涵盖GAITs使用背景下学业成功影响因素的复杂性。

论文解读：《A Genetic Algorithm-Optimized MLPNN to Analyze the Impact of Generative Artificial Intelligence Tools on Academic Performance—A Case Study》发表于《Big Data and Cognitive Computing》

一、研究背景与立题依据

随着大语言模型等生成式人工智能工具(Generative AI Tools, GAITs)在教育领域普及，现有研究对其学业影响结论矛盾：部分认为可提升动机与效率，部分指出过度使用削弱深度知识习得与批判性思维。传统统计方法假设变量间线性关系，难以刻画GAITs使用行为、个体学习习惯与学术情境间的非线性交互。多层感知器神经网络(Multi-Layer Perceptron Neural Network, MLPNN)可建模非线性关系，但其性能高度依赖超参数(学习率、隐层神经元数、权重初始值等)配置；遗传算法(Genetic Algorithm, GA)受自然选择启发可在解空间全局寻优，适合优化MLPNN超参数。目前尚无研究将GA优化MLPNN用于GAITs对学业成绩影响的分析，此为本文研究缺口。研究人员以摩洛哥三所工程学院学生为对象，结合传统统计分析与GA-MLPNN混合模型，探究GAITs使用各维度(熟悉度Familiarity、使用频率Frequency、使用时长Duration、依赖程度Doing)与学期末学业成绩(Note, 0–4有序标度)的关系及预测效能。

二、主要关键技术方法

研究人员采用横断面调查设计，选取摩洛哥ENSI Tanger、ENSA Tetouan、EST Fez三所院校2024/2025学年工科生，经筛选获有效问卷294份(n=294)，Cochran公式验证样本量满足95%置信水平、5%误差要求。问卷含人口学信息与GAITs四维度李克特式量表，Cronbach's α=0.68，所有题项强制作答并编码为0–4有序尺度，无缺失值。统计分析先进行多重共线性检验(皮尔逊相关、方差膨胀因子Variance Inflation Factor, VIF)、序数逻辑回归(Ordinal Logistic Regression)与混淆矩阵评估；继而构建MLPNN(输入层4神经元–单隐层10神经元(sigmoid激活)–输出层1神经元(双极sigmoid激活，输出重缩放至0–4))，以GA优化网络权重、偏置与学习率η：种群规模50、实数编码染色体、算术交叉与变异、精英保留(elitism, k为种群比例)、适应度函数为训练集均方根误差(Root Mean Square Error, RMSE)，迭代1000代作为终止准则，独立重复50次取最优配置。数据集按70%训练/30%测试划分，以RMSE、准确率(Accuracy)、精确率(Precision)、召回率(Recall)、F1值、受试者工作特征曲线下面积(Area Under the ROC Curve, AUC-ROC)及混淆矩阵评估模型，并与未优化MLPNN、支持向量机(Support Vector Machine, SVM)、随机森林(Random Forest, RF)对比。

三、研究结果

4. Results and Discussion

经相关矩阵与VIF检验(VIF 1.22–1.42 < 5，Pearson系数 < 0.5)，自变量间无显著多重共线性，全数保留入模。序数回归显示仅Familiarity估计值0.5579(p=2.86×10^?5< 0.05)对Note有显著正向影响，Frequency、Duration、Doing p > 0.1143不显著；混淆矩阵得序数回归分类准确率39.8%，证实GAITs四变量单独解释力低。

GA-MLPNN测试集RMSE=0.903，低于未优化MLPNN(0.950)、SVM(0.918)、RF(0.921)。二分类视角(Note≥3为正类)混淆矩阵示：真负(True Negative, TN)=58，真正(True Positive, TP)=2，假正(False Positive, FP)=0，假负(False Negative, FN)=29；Precision=1.000，特异度(Specificity)=1.000，Recall=0.064，F1-score=0.121，AUC-ROC=0.759。RF的AUC-ROC略高(0.784)但TP=0致Recall与F1-score为0；唯GA-MLPNN能识别少量正类且RMSE最低，说明GA优化提升MLPNN拟合能力但仍受限于输入变量集局限。研究人员指出学业成绩同时受教育史、动机、社会经济地位、家庭支持、院校环境等多维因素影响，仅GAITs四维度不足以充分预测。

四、讨论与结论翻译

结论：本研究以摩洛哥三所工程学院学生为样本探讨GAITs使用对学业成绩之影响。传统统计显示GAITs相关变量单独预测力有限，故构建GA优化MLPNN混合模型。GA-MLPNN测试集RMSE=0.903，较未优化MLPNN(0.950)、SVM(0.918)、RF(0.921)更低；准确率67.4%、精确率1.000、F1-score 0.121、AUC-ROC 0.759，虽召回率低仅识别少数优绩生，但相较基准模型有所改善。研究表明本研究所涉GAITs变量孤立情况下对学业成绩预测能力有限，不支持GAITs必然有益或有害的简化观点。理论层面融合传统统计与神经网络法丰富教育领域生成式AI文献；实践层面为教育者及政策制定者合理融入GAITs、制定学术诚信指南及调整考核方式(强调批判性思维与项目制学习)提供参考；社会层面揭示摩洛哥高教中AI工具接入与熟悉度差异可能引致数字鸿沟。局限含样本仅294人工科生来自三校、自报告偏差、未纳入其他协变量、横断面设计无法确立因果；未来宜扩大多学科多区域样本、增补解释变量并采用纵向设计。

热点排行