大型语言模型（Large Language Models, LLMs）对中国高等教育英语笔译协作学习过程与结果的影响

《Scientific Reports》：The impact of large language models on collaborative learning processes and outcomes in higher education for English translation

【字体：大中小】 时间：2026年06月13日 来源：Scientific Reports 3.9

编辑推荐：

　　摘要：协作学习是中国高等教育英语笔译教学中的重要方法，并受到大语言模型（Large Language Models, LLMs）发展的影响。既往研究主要关注LLM被个体学生单独使用的情况，缺乏LLM作为"第三参与者"介入小组动态时对群体互动影响的认识。为填补此

摘要：协作学习是中国高等教育英语笔译教学中的重要方法，并受到大语言模型（Large Language Models, LLMs）发展的影响。既往研究主要关注LLM被个体学生单独使用的情况，缺乏LLM作为"第三参与者"介入小组动态时对群体互动影响的认识。为填补此空白，研究人员考察了将LLM作为第三参与者纳入后，对人（人）—人—AI三元协作（Human-Human-AI Triad）中协作学习过程与结果的影响。研究采用比较实验设计，涉及372名中国高校英语专业本科及硕士研究生，随机分为两组：对照组在无LLM辅助下纯人—人协作，实验组采用人—人—LLM三元协作模式。两组翻译质量、问卷数据及过程记录经混合方法（Mixed-Methods Approach）分析比较。研究结果显示，两组最终译文质量无显著差异，但实验组报告了显著更高的感知效率（Perceived Efficiency）与任务满意度（Task Satisfaction）。质性分析阐明该结果，表明LLM的参与改变了协作程序——决策过程从"生成性协商（Generative Negotiation）"转向"评估性协商（Evaluative Negotiation）"，并导致非正式角色的形成。研究得出结论：在协作学习中，LLMs影响的是过程而非直接提升内容产出。上述发现对中国高等教育环境下有效的人—AI英语笔译教学设计具有重要意义。

论文解读：《The impact of large language models on collaborative learning processes and outcomes in higher education for English translation》发表于《Scientific Reports》

研究背景与问题提出

在英语笔译高等教育中，协作学习（Collaborative Learning）是建构主义教学的核心方法，依赖社会成员间意义协商与文化交流。当前生成式人工智能特别是大语言模型（Large Language Model, LLM）已被广泛用于高等教育以提升效率，但既有文献多聚焦LLM对个体译者译效或个性化学习的辅助作用，忽视了LLM作为具社会认知属性的"第三协作者"介入人—人协作时对小组动力学（Group Dynamics）、知识共建及社会性共享调节学习（Socially Shared Regulation of Learning, SSRL）的改变。传统机器翻译后编辑呈线性流程易导致认知卸载（Cognitive Offloading）与批判性思维退化；而LLM具备对话性与自主性，理论上可构成人—人—AI三元体（Human-Human-AI Triad），其具体教育效应尚待实证。因此研究人员提出核心研究问题：LLM的存在如何改变人类学习者间的交互从而影响学习结果与过程？

研究方法概要

研究人员采用目的抽样选取中国某大型公立大学外国语学院372名已完成至少一学期"笔译"或"商务英语笔译"课程的英语专业三、四年级本科生及硕士研究生（女生87.4%），随机编为124组（每组3人），再随机分配为对照组（62组，仅用在线词典与术语库的人—人协作）与实验组（62组，人—人—LLM三元协作，共享LLM账户设定为"第三协作者"，Temperature=0.7，采用支架式交互提示策略）。任务为合作翻译约500字含专业术语与商务语用策略的文本，限时90分钟并全程录音录屏，收集LLM提示词与输出日志。因变量包括：最终译文质量（由两名资深商务英语译员按忠实度Fidelity、流畅度Fluency、术语准确度Terminology Accuracy、语用文体适切性四维量规评分，组内相关系数ICC=0.86）、感知协作效率、任务满意度、认知负荷（每15分钟瞬时单项目7点评测+任务后多项目认知负荷量表）；过程数据含协作对话转录文本。数据分析采用收敛平行混合方法——定量部分做独立样本t检验与双因素方差分析（Two-way ANOVA），定性部分基于扎根理论（Grounded Theory）对转录文本及LLM交互日志做主题分析（Thematic Analysis），并以分布式认知（Distributed Cognition）理论框架解读三元互动中的信息通路（Information Pathway）与权威转移（Transfer of Authority）。

研究结果

Analysis of translation quality（译文质量分析）

独立样本t检验显示实验组（M=85.2, SD=5.4）与对照组（M=84.5, SD=5.9）译文质量无显著差异（t(122)=0.78, p=0.437, Cohen's d=0.12）。实验组分数离散度更小、异常值更少，提示LLM可能起到"保底保障（Floor Guarantee）"防止低水平组严重失误，同时有"天花板约束（Ceiling Constraint）"抑制高水平组创造性探索。

The influence on subjective experience（对主观体验的影响）

问卷显示实验组在感知协作效率（Perceived Collaboration Efficiency）与任务满意度（Task Satisfaction）上显著高于对照组（p<0.01），认知负荷（Cognitive Load）无显著差异。访谈表明学生认为LLM减少资料搜集与初稿撰写耗时，使其聚焦于复杂决策与润色；但该高效感知可能与邓宁—克鲁格效应（Dunning-Kruger Effect）相关——实际译品未提升而自信度上升。

The change in the cooperative decision-making approach（协作决策方式的变化）

对话转录分析发现：对照组以"我们该怎么译？"的生成性协商（Generative Negotiation）为主；实验组转为围绕"LLM给出的选项中哪个更合适？"或"LLM译文有何问题？"的评估性协商（Evaluative Negotiation），讨论更快收敛于对语气、专业度与准确性的对比评价。

Reconfiguration of team interaction dynamics（团队互动动力的重构）

实验组中常出现一名成员担任非正式"提示工程师（Prompt Engineer）"负责与LLM交互，致任务微集中化。知识权威来源统计显示：实验组50.4%的关键决策依据"AI建议"，同伴商议降至28.4%，外部资源降至21.2%（对照组分别为同伴商议58.7%、外部资源41.3%），表明LLM在协作中被赋予"知识权威（Knowledge Authority）"地位，影响小组权力分布。

Learners' perception model of AI roles（学习者对AI角色的认知模型）

主题分析归纳学生赋予LLM四重角色——草稿生成器（Draft Generator）、信息检索器（Information Retriever）、创意催化剂（Creativity Catalyst）、质量检查者（Quality Checker），且随任务阶段（初译—深加工—审校）权重动态变化。

Changes in cognitive load during cooperation（协作过程中认知负荷的变化）

每15分钟瞬时认知负荷测评显示两组均在任务中段（30–45分钟）达峰值，但实验组呈先升后降的适应曲线：初期（0–15分钟）因磨合LLM交互负荷略高（M≈5.5），建立三元协作后迅速降至较低稳定水平（M≈3.0–3.5），说明LLM可在克服初始交互成本后缓解认知负荷峰值。

Further analysis of demographic variables（人口学变量的进一步分析）

双因素ANOVA显示性别与实验条件无显著交互效应（p=0.366），LLM对感知效率的提升不受性别影响。但学术层次具显著交互效应（p<0.001）：研究生（尤其研二）效率增益最大，大四次之，大三次之，说明更高语言评估能力的学生能更充分利用LLM作协作伙伴。

讨论与结论总结

讨论部分指出LLM将协作决策从生成推向评估，符合布鲁姆教育目标分类修订版（Revised Bloom's Taxonomy）中高阶思维要求，形成包含人—人—AI的分布式智能网络；但AI建议占决策权50.4%提示需警惕认知屈从（Epistemic Submission）与盲目信任，教学中应培养信任校准（Trust Calibration）与AI素养（AI Literacy）中的批判怀疑态度，注意LLM隐含文化偏见与幻觉（Hallucination）风险。LLM具"保底保障—天花板约束"双重性，建议教学中按学生水平分阶段引入AI，初学者附加挑战防过早依赖，进阶者训练其作战略伙伴；评估应从产物导向转向过程导向，要求学生提交含AI初稿、迭代提示词及译注说明的翻译档案（Translation Portfolio）以考察元认知评估力。未来可探索多模态LLM（Multimodal LLM, MLLM）支持的符号学调适与结合检索增强生成（Retrieval-Augmented Generation, RAG）的事实核查。

结论（翻译自Conclusion部分）

研究人员发现，将LLM整合入笔译协作学习主要不是为了提高最终产出质量，而是从根本上改变团队协作方式。AI成员的引入修改了原有权力关系，将传统生成性协商转换为评估性协商模式。此种系统性转变使成员从例行任务中解放出来，使学习者能更多地关注元认知审视与战略决策。需注意本实验未设纯人对照外的一对一人与AI二元组，故权威与协商模式变化无法完全与人—人小组动力剥离，结果仅代表人—人—AI三元模型在特定情境下的表现。未来需更多对比组确认自动化对个体能力与团队绩效的影响，并重视AI作为新兴知识权威的地位——需在定期语言基础训练中协调人类理性思维与自动化流程，方能在智能时代培养出具备扎实双语能力与评估性主体性的专业译员。

热点排行