教育聊天机器人：提升在线评估技能的创新之道

首页今日动态人才市场新技术专栏中国科学人云展台
BioHot
云讲堂直播会展中心特价专栏技术快讯免费试用

生物通官微
陪你抓住生命科技
跳动的脉搏

生物通首页 > 今日动态 > 正文

【字体：大中小】 时间：2025年05月12日 来源：Computers in Human Behavior: Artificial Humans

编辑推荐：

　　在信息爆炸的时代，学生在线评估技能不足。研究人员开展 “通过教育聊天机器人提升在线评估技能” 的研究，发现聊天机器人干预组表现更优。这表明其或能有效提升该技能，对教育领域意义重大。

　　在当今数字化时代，互联网成为人们获取信息的主要渠道。然而，网络信息繁杂，充斥着虚假、误导性内容，如社交媒体上的虚假新闻、广告伪装成的信息等。这使得人们在面对海量信息时，难以分辨其可信度和相关性。学生作为互联网的频繁使用者，在进行自我调节学习时，常常因无法准确评估网络信息，影响学习效果，甚至可能在生活、学习、工作等多方面做出错误决策。比如，在撰写学术论文时引用了不可靠的信息源，导致论文质量下降。

为了解决这一问题，来自国外的研究人员开展了一项关于 “通过教育聊天机器人提升在线评估技能” 的研究。该研究成果发表在《Computers in Human Behavior: Artificial Humans》杂志上。

研究人员主要采用了以下关键技术方法：首先构建基于认知学徒模型（Cognitive Apprenticeship model）的教育聊天机器人，其基于谷歌 Dialogflow - ES 平台开发，遵循预定义意图；其次使用基于情景的在线信息评估测试环境（EVON）来评估干预效果；还运用自我效能量表（SWE - IV - 16）测量参与者信息搜索行为的自我效能。研究招募了 156 名本科心理学学生作为样本。

研究结果如下：

主分析结果：进行了三项单尾 Welch t 检验及 Bonferroni 校正和多元回归模型分析。假设 1 部分得到支持，聊天机器人组在测试中的表现显著优于基线组，但与清单组无显著差异；假设 2 未得到支持，清单组未优于基线组；假设 3 中自我效能未对训练条件和测试表现的关系起到调节作用，且信息搜索行为的自我效能与实际测试表现呈负相关。
探索性分析结果：
- 训练阶段表现：聊天机器人组在训练阶段表现优于基线组，与清单组无显著差异，清单组与基线组也无显著差异。
- 认知负荷比较：方差分析（ANOVA）显示三组在认知负荷上无显著差异，认知负荷在各条件下均为中等水平。
- 学习判断比较：训练条件对学习判断（JOL）有显著影响，聊天机器人组的 JOL 显著高于基线组和清单组，清单组与基线组无显著差异。
- 聊天机器人交互评估：学生对聊天机器人的学习体验评价较为积极，但也存在一些批评，如理解能力、干预主动性和回复长度等问题。

研究结论和讨论部分指出，教育聊天机器人干预能够提升学生的在线评估技能，尽管与清单组相比优势不明显，但相比基线组仍具有实际意义。不过，该研究存在局限性，如模拟环境与现实存在差距、测试项目较简单、样本具有局限性、干预时间较短等。未来研究可朝着开发更难的测试项目、延长干预时间、采用 LLM - 基于的聊天机器人等方向展开。同时，随着 AI 技术的发展，教育聊天机器人在提升公民在线评估技能方面具有潜力，但也需注意避免过度依赖，确保其促进批判性思维的发展。这项研究为教育领域利用人工智能提升学生在线评估技能提供了重要参考，推动了混合智能系统在教育中的应用探索。

热点排行

新闻专题

联系信箱：

粤ICP备09063491号