基于人工智能语音交互的虚拟现实高级生命支持训练效果评估：随机对照试验

首页今日动态人才市场新技术专栏中国科学人云展台
BioHot
云讲堂直播会展中心特价专栏技术快讯免费试用

生物通官微
陪你抓住生命科技
跳动的脉搏

生物通首页 > 今日动态 > 正文

【字体：大中小】 时间：2025年06月06日 来源：JMIR Serious Games 3.8

编辑推荐：

　　推荐：本研究针对VR(虚拟现实)医疗培训中交互方式的优化问题，通过随机对照试验比较AI语音控制与传统控制器在ACLS(高级心脏生命支持)训练中的效果。结果显示VR控制器组在考核成绩上显著优于语音组(P=0.005)，但两组临场感无差异，且语音组存在过度自信偏差。研究为VR医疗教育中交互方式选择提供了实证依据，发表于《JMIR Serious Games》。

在医疗教育领域，虚拟现实(VR)技术正以前所未有的方式重塑培训模式。随着头显设备便携性和性价比的提升，VR在高级心脏生命支持(ACLS)等急救技能培训中展现出独特优势——每年全球有超百万医护人员需要接受此类周期性复训。然而传统VR系统依赖手持控制器的交互方式存在学习曲线陡峭、操作不够直观等问题，而人工智能(AI)驱动的语音交互技术虽被寄予厚望，其实际效果却缺乏系统验证。

针对这一技术空白，Acibadem Mehmet Ali Aydinlar大学的研究团队开展了一项开创性研究。他们设计随机对照试验，比较AI语音控制与传统VR控制器在VR-ACLS训练中的表现差异，相关成果发表于《JMIR Serious Games》。研究特别关注两种交互方式对学员操作成绩、临场感(presence)和自信心等关键指标的影响，这些因素直接关系到培训转化效果。

研究采用Wit.ai自然语言处理(NLP)平台构建语音交互系统，通过Unity引擎开发符合国际复苏指南的VR-ACLS训练模块。62名麻醉学专业学生被随机分为语音组(n=31)和控制器组(n=31)，两组均完成两次训练模式后接受考核。通过土耳其版临场感问卷(PQ)、置信度评估和标准化测试等多维度指标收集数据，采用混合方差分析(ANOVA)和Welch t检验等方法进行统计比较。

主要研究发现

成绩提升无组间差异
混合ANOVA显示两组预-后测成绩提升幅度相似(P=0.83)，但语音组基础成绩更高(F_1,57
=6.43, P=0.01)。这表明VR培训本身具有显著学习效果，但交互方式不影响知识获取。

控制器组考核优势显著
核心发现显示控制器组VR考核成绩(80.47±13.12)显著优于语音组(66.70±21.65, P=0.005)，效应量d=0.77。值得注意的是，两组考核用时无差异(P=0.35)，排除了时间因素对成绩的影响。研究者认为这可能源于土耳其语语音识别的特定挑战，包括指令延迟和语境理解误差。

交互方式影响自我评估
尽管实际表现差异显著，两组置信度评分却相近(3.79 vs 3.60, P=0.49)。深入分析发现语音组存在过度自信偏差(0.09±0.24)，而控制器组呈现轻度低估倾向(-0.09±0.18)，组间差异达P=0.002。这种"能力错觉"在医疗教育中尤为关键，可能影响临床决策质量。

临场感体验相当
与预期相反，语音组临场感评分(5.18±0.83)与控制器组(5.42±0.75)无统计学差异(P=0.25)。研究者指出，语音识别中断可能抵消了其理论上的沉浸优势，这与前人关于系统延迟破坏临场感的研究一致。

这项研究揭示了VR医疗教育中交互技术选择的复杂性。虽然AI语音控制展现出人性化交互的潜力，但当前技术限制——特别是非英语语境下的识别精度问题——使其在要求精准操作的ACLS训练中暂处劣势。值得注意的是，研究首次报道了交互方式对学员自我评估的微妙影响，这对设计具有元认知反馈的培训系统具有重要启示。

未来研究应聚焦多语言NLP模型的优化，以及混合交互模式(语音+控制器)的探索。随着AI技术的迭代，语音交互有望突破当前局限，为特殊需求学员(如行动障碍者)提供无障碍培训方案。该研究为VR医疗教育的交互设计提供了关键循证依据，也为AI教育应用的效能评估建立了方法论范式。

热点排行

新闻专题

联系信箱：

粤ICP备09063491号