面向沉浸式学习环境中混合智能的人智协作设计：一个概念性框架

首页今日动态人才市场新技术专栏中国科学人云展台
BioHot
云讲堂直播会展中心特价专栏技术快讯免费试用

生物通官微
陪你抓住生命科技
跳动的脉搏

生物通首页 > 今日动态 > 正文

《Systems》：Designing Human–AI Collaboration for Hybrid Intelligence in Immersive Learning Environments: A Conceptual Framework

【字体：大中小】 时间：2026年06月09日 来源：Systems 3.1

编辑推荐：

　　学习系统向混合智能（HI）的范式转换，强调将人类与人工智能的认知能力整合为统一的问题解决过程。然而，在沉浸式学习环境中实现此类系统的设计原则尚不充分。通过扩展现实（XR）实现的沉浸式学习环境，为具身交互、空间交流与临场感（co-presence）引入了独特的可

学习系统向混合智能（HI）的范式转换，强调将人类与人工智能的认知能力整合为统一的问题解决过程。然而，在沉浸式学习环境中实现此类系统的设计原则尚不充分。通过扩展现实（XR）实现的沉浸式学习环境，为具身交互、空间交流与临场感（co-presence）引入了独特的可供性（affordance）与挑战，亟需重新思考协作的展开方式。本概念性论文提出了一个框架及一组设计承诺，旨在沉浸式学习环境中实现面向混合智能的合理人智协作。基于人智协作与人智团队（Human–AI teaming）、XR交互设计、学习科学及认知工效学领域的研究与理论，研究人员识别出协作的四个关键维度：协作能动性与角色分配、共享注意与调节、具身与空间交互，以及相互可理解性与适应性支持。研究人员阐述了一个概念性框架，描述人类与AI如何在沉浸式学习空间中联合达成目标、协商角色、协调注意并参与知识共建，以实现混合智能。研究人员进一步论证，沉浸式情境需要新形式的相互可理解性、空间交流与适应性支持，以实现以适应性协同智能为特征的混合智能，从而实时改进学习过程。此外，研究人员推进了针对沉浸式学习的混合智能定义，识别出三种涌现特性：协作流畅性、适应性临场感与分布式知识增长。文章最后阐述了对研究人员和实践者的启示，并识别出未来工作需应对的构成性设计张力。本论文属概念性研究；所提出的框架作为具有理论基础的未来实证检验假设。未来研究方向包括：在实际XR环境中通过观察性与实验性研究验证涌现特性，并开发足以测量该框架所识别的空间性、具身性与实时性维度的工具。

本研究旨在为沉浸式扩展现实（XR）学习环境中的人智协作建立概念性理论框架，以推进混合智能（HI）的理论理解。研究背景源于人工智能（AI）在教育领域应用需求的快速增长，以及生成式AI嵌入教育系统所引发的可靠性担忧。现有研究主要集中于基于文本的交互与反馈导向系统，而沉浸式XR环境所特有的空间性、具身性与临场感条件，使既有人智协作框架面临三重缺口：对空间分布的具身交互作为首要交流模式重视不足；人智参与者之间的临场感及其社会动态探索不充分；针对沉浸式环境中实时多模态角色协商的设计指导尚待发展。

研究人员采用叙事性概念综合（narrative conceptual synthesis）方法，整合四种理论传统构建分析基础。能动性（agency）与社会文化视角阐释学习者选择、设定目标与影响结果的能力，强调AI系统应在支持学习的同时维护学习者能动性，避免过度指导。分布式认知理论将认知过程理解为超越个体而扩展至工具、人工制品与其他智能体的交互，Hutchins的经典研究展示了认知如何在人群与仪器间分布，Clark与Chalmers的延展心智论题论证外部工具可成为认知过程的组成部分，Siemens的连接主义则强调知识分布于数字网络并通过连接获取。学习调节理论从自我调节学习（SRL）扩展至社会共享调节，关注群体如何共同建构包含共享目标设定与联合适应的调节过程，AI可通过追踪学习者行为、识别模式并提供及时提示以支持元认知过程，但需防范过度支架（over-scaffolding）风险。具身认知理论主张认知过程根植于感觉运动经验，抽象思维同样受身体与知觉交互塑造，XR环境中学习者通过手势、注视与移动进行交互，要求AI具备解释手势、响应注视并在环境中嵌入反馈的多模态能力。

基于上述理论整合，研究人员提出沉浸式学习环境中的混合智能定义：人类学习者与AI智能体共同存在于空间扩展现实环境中，通过动态角色协商、联合空间注意、具身交互与相互可理解性，实现各自认知、知觉和交流能力的无缝整合，从而达成任何一方无法独立维持的知识共建与意义建构形式。该定义包含三个核心特征：无缝整合同时保持AI作为参与者的可见性；知识共建是任务完成与问题解决之外的定义性成果；意义建构作为知识共建得以实现的认知过程，在Turner等人的多面意义建构理论（multifaceted sensemaking theory）框架下运作于两个同时层面——学习者在XR环境中进行感知与意义建构，而人智二元组则参与联合的意义赋予（sensegiving）。

框架识别出人智协作的四个核心维度。第一维度为协作能动性与角色分配，涵盖分布式动态能动性、基于学习者状态与任务需求的动态角色切换、差异化的权限梯度结构、保持学习者主动认知参与的自主动作保护干预，以及承认人机能力差异的非对称任务所有权。第二维度为共享注意、调节与协调，包含通过注视追踪与空间锚定实现的联合空间注意、基于多模态信号监测的AI辅助协同调节，以及要求实时学习者状态建模以区分生产性犹豫与无效率困惑的时间对齐。第三维度为具身与空间交互，涉及手势与注视基础通信、具备物理位置与近体行为的空间参与者AI身份、包含注视接触与身体朝向的社会信号，以及通过环境修改嵌入反馈的环境信号。第四维度为相互可理解性与适应性支持，包含情境适宜的可解释反馈、避免替代学习者自主能力的适应性支持，以及随学习者能力发展而渐进撤除的支架消退（scaffolding fading）机制。

当四个维度同时协调激活时，涌现三种特性表征人智协作状态。协作流畅性指人智二元组在角色、模态与任务阶段间无摩擦转换的能力；适应性临场感体现AI智能体作为真实协作伙伴的持续存在感及其 engagement水平的动态调整；分布式知识增长则描述协作片段的学习成果超越任何一方单独贡献所能解释的状态。三项基础设计要求随之确立：关系架构将系统视为统一协作关系而非功能集合；时间敏感性作为基础设计约束而非附加特性；认识谦逊要求系统培养学习者独立判断能力而非制造依赖。

研究人员进一步推导出五项设计承诺。设计承诺一为构建相互可理解性，通过预期性表达行为、空间情境化可解释反馈和不确定性显示实现。设计承诺二为支持流畅人智团队协作，涉及实时能动性感知、适应XR空间与具身情境的轮换协议，以及区分生产性挣扎与无效率困惑的可中断性校准。设计承诺三为利用空间与具身交流通道，包括注视响应性AI朝向、手势指涉和环境注释。设计承诺四为适应性支架而不取代能动性，通过即时形成性提示、可感知且可逆的支架消退，以及学习者自主控制支持水平实现。设计承诺五为促成联合意义建构，涉及AI意义赋予行为、反事实提示和共享表征性人工制品的共建。

研究结论部分，研究人员将本框架的主要贡献概括为三方面：其一，提供了沉浸式学习情境专属的混合智能定义，以联合意义建构建为认知机制，以协作流畅性和适应性临场感为维系该意义建构的关系属性；其二，从该理论中推导出五项设计承诺及适用于XR环境的具体交互策略；其三，识别出自主动能与AI主动性、沉浸与认知负荷、有效协作与长期学习者独立性之间的构成性张力。这些张力凸显设计者需加以管理以创造高效学习体验，同时促使研究者运用足以应对其复杂性的方法论工具开展实证研究。

需承认的局限包括：该框架属概念性研究且未经实证检验；所提出的涌现特性尚待操作化与测量；设计承诺虽具理论基础但缺乏实践验证；框架适用范围有意保持一般性，其在临床教育、STEM学习、专业培训和语言习得等具体领域的应用需进一步领域特异性阐发与实证调适。研究人员认为，这些局限并非缺陷，而是新兴领域前沿概念工作的自然状态。该框架的价值在于其组织和引导探究的能力，旨在为研究人员、设计者和实践者提供发展以混合智能、具身交互和有意义的混合智能教育成果为特征的沉浸式人智协作学习系统的理论基础。

联系信箱：

粤ICP备09063491号

热点排行