编辑推荐:
当前 LLMs 在教育领域应用中,助力教师教学方面研究有限。研究人员开展以高中数学为例,利用 LLMs 模拟教学互动、生成反思来提升教学计划质量的研究。结果显示该方法显著提升教学计划质量,对教学准备意义重大。
在当今数字化时代,教育领域正经历着深刻的变革,大语言模型(LLMs)凭借其强大的自然语言处理能力,逐渐渗透到教育的各个角落。它在智能辅导系统和教学辅助工具中表现出色,为学生提供个性化的学习体验,然而,在教师教学支持方面的研究却相对滞后。目前,虽然有研究尝试利用 LLMs 评估教师课堂表现、用于教师培训或生成教学材料,但这些研究成果都存在着诸多问题,如评估准确性不足、教学指导缺乏创新性、教学材料缺乏实用性等。这些问题使得 LLMs 在教师教学准备、课堂教学以及课后反思改进等环节的作用未能得到充分发挥,也限制了其在教育领域的广泛应用。为了填补这一空白,华东师范大学的研究人员开展了一项极具创新性的研究,旨在探索 LLMs 在提升教学计划质量方面的巨大潜力,相关成果发表在《npj Science of Learning》上。
该研究主要运用了以下关键技术方法:首先,构建了包含不同来源教学计划的数据集,涵盖基于 PCK 理论和数学问题链生成的教学计划、GPT - 4 直接生成的教学计划、经验丰富教师撰写的高质量教学计划以及职前教师编写的教学计划。其次,设计特定的提示指令,引导 GPT - 4 模拟师生互动过程,生成教学反思,并据此改进教学计划。最后,邀请具有丰富教学经验的数学教师,依据包含 9 个类别和 19 个维度的评估框架,对教学计划进行手动评分和分析。
增强教学计划在各评估维度的描述性统计分析
研究人员对 16 个评估维度进行了描述性统计分析,涉及 480 个教学计划样本,包括 240 个增强前和 240 个增强后的教学计划。在问题链设计方面,增强后的教学计划在设计丰富问题情境(Q1)维度上平均得分超 7.0,在设计连贯且具挑战性学习任务(Q2)和设计变式练习巩固知识(Q3)维度上平均得分超 6.5,表明 LLMs 有效提升了问题链设计质量。但在促进师生互动的学习活动设计(A1)维度,与人类教师编写的高质量教学计划相比仍有差距。而在与教学目标一致的活动设计(A2)、学科知识解释总结(C1、C2)、教学方法选择(M1)和策略应用(M2)等维度,增强后的教学计划平均得分在 6.8 左右,有显著提升,部分甚至超越了人类教师编写的高质量教学计划。在学科历史文化引入(C3)和跨学科内容设计(D1)维度,增强后的教学计划表现突出,超越了人类教师编写的计划,但得分仍有提升空间。在识别学生差异(E1)、多样评估(E2)以及知识范围设计(R1)等维度,增强后的教学计划达到或超过了人类教师编写的高质量教学计划水平。从整体得分来看,经过增强的教学计划在多数维度上得分高于基线教学计划,其中经过两轮 GPT - 4 改进的教学计划(数据集 E)在多数维度上平均得分超过高质量人类编写教学计划,基于职前教师教学计划改进的教学计划(数据集 H)平均得分也接近两轮 GPT - 4 增强的教学计划。
增强教学计划按维度和知识模块的交叉分析
以经过一轮 GPT - 4 改进的教学计划数据集 D 为例,在不同知识模块中进行更深入分析。在 “代数” 模块,改进后的教学计划在 11 个评估维度上超过人类教师编写的高质量教学计划,在准确解释学科概念、运用多样教学方法策略和评估学生学习等方面得分超 7 分。在 “函数” 模块,改进后的教学计划在 13 个评估维度上超越人类教师编写的计划,在设计挑战性学习任务、准确解释理论、总结知识等方面表现出色,平均得分超 7 分。“几何” 模块整体表现稍逊,仅在设计有效科学问题情境维度得分超 7 分,多数得分在 6.4 左右。“统计” 模块表现最佳,13 个评估维度得分超 7.3 分,在多个维度达到高质量教学计划水平。对不同类型问题链的评估显示,“统计” 模块中三种类型问题链表现最佳,基于情境和总结的问题链在各知识模块平均得分超 6.5,陷阱型问题链在 “统计” 模块得分超 6.5,其他模块超 6.0。通过 Kruskal - Wallis H 检验发现,“统计” 模块在多个评估维度上显著优于其他模块,“函数” 模块略超 “代数” 和 “几何” 模块。
研究结论表明,利用 LLMs 提升教学计划质量的方法,在所有知识模块中均取得了显著效果,改进后的教学计划在各评估维度的表现与优秀人类教师编写的高质量教学计划相近。这一成果证实了通过引导 LLMs 进行模拟、反思和改进来提升教学计划质量的有效性。研究发现不同知识模块表现存在差异,“几何” 模块因部分概念需借助几何图形理解,仅靠 LLMs 文本描述难以实现理想的 “代数与几何融合”,导致评估表现较低;“代数” 和 “函数” 知识模块在设计和解决中高难度问题方面,LLMs 还有提升空间;而 “统计” 模块因其注重提供丰富问题情境,与 LLMs 多学科知识支持的优势相契合,所以表现最佳。
该研究成果对 LLMs 在教育领域的应用具有重要意义。它为教师教学准备提供了新的思路和方法,帮助教师提前优化教学计划,降低教学风险,提高教学质量,使学生能够从更优质的教学材料中受益。同时,也为职前教师学习教学设计提供了有价值的参考,推动了教育领域中人类与人工智能协作教学设计的发展。未来,随着 LLMs 技术的不断发展,有望进一步探索多智能体框架在教学模拟中的应用,实现更复杂、多样化的教学场景模拟,进一步提升教学计划的质量,推动教育教学的创新发展。