VOXI量表:基于共识驱动的计算机语音用户体验标准化测量工具开发与验证

【字体: 时间:2025年07月19日 来源:International Journal of Human-Computer Studies 5.3

编辑推荐:

  为解决语音用户体验(Voice UX)测量工具缺乏标准化的问题,研究人员通过系统文献综述(N=49)和两项验证研究(N=100; N=150),开发了24项VOXI量表,确认了信任度(Trustworthiness)、吸引力(Appeal)、拟人化(Anthropomorphism)、舒适度(Comfort)和厌恶感(Aversion)五个核心维度,为语音交互研究提供了标准化测量工具。

  

随着智能语音助手(如Siri、Alexa)的普及,语音交互已成为人机交互的重要方式。然而,当前语音用户体验(Voice UX)研究面临关键挑战:测量工具分散且缺乏标准化,既有量表多聚焦通用用户体验或仅关注可用性,未能充分体现语音交互的独特性。这种碎片化现状严重阻碍了研究结果的可比性和理论构建。

为应对这一挑战,日本东京工业大学的研究团队开展了系统性研究。通过严谨的两阶段研究设计,团队首先对ACM、IEEE和Web of Science三大数据库的49篇文献进行系统综述,构建了包含独立变量(IV)和依赖变量(DV)的理论框架。随后通过探索性因子分析(EFA)和验证性因子分析(CFA)对100名和150名日本参与者进行实证验证,最终开发出具有良好心理测量特性的24项VOXI量表。该成果发表在《International Journal of Human-Computer Studies》,为人机交互领域提供了首个基于共识的语音用户体验标准化测量工具。

研究采用三项关键技术方法:(1)PRISMA框架指导的系统文献综述,建立测量共识;(2)最大似然估计结合斜交旋转的探索性因子分析,从28项初始条目中提取五个维度;(3)多指标验证性因子分析,使用RMSEA、CFI和TLI等指标评估模型拟合度。研究样本通过Yahoo! Crowdsourcing平台招募,涵盖18-75岁日本用户,确保人口多样性。

系统综述建立测量共识
文献分析揭示了当前研究的四大局限:44.7%的工具未经验证、86.5%依赖主观测量、20.5%过度关注可用性、缺乏语音特性专项评估。研究团队由此构建了包含8类IV和12类DV的整合框架,特别新增"社会认同"(Social Identity)和"称谓"(Designation)等创新维度。

量表开发与验证
通过599个初始条目的内容分析,团队开发了28项初步量表,经EFA分析确立五个核心维度:信任度(α=.94)含8项如"可信赖的"(Trustworthy);吸引力(α=.93)含4项如"愉悦的"(Enjoyable);拟人化(α=.89)含4项含反向计分项;舒适度(α=.93)含5项如"温暖的"(Warm);厌恶感(α=.86)含3项如"可怕的"(Scary)。CFA验证显示模型拟合良好(RMSEA=.08, CFI=.92, TLI=.91)。

心理测量特性分析
所有维度均展现优秀信效度:组合信度(CR)在.84-.96之间,平均变异抽取量(AVE)在.64-.74之间,且AVE均大于共享方差,证明区分效度。值得注意的是,"吸引力"与"舒适度"虽相关(r=.45)但代表不同情感唤醒水平,分别对应高唤醒积极情绪和低唤醒放松状态。

这项研究具有三重理论意义:首先,VOXI填补了语音交互领域标准化测量工具的空白,使不同研究结果具有可比性;其次,提出的五维模型整合了认知(信任度)、情感(吸引力/厌恶感)和社会认知(拟人化)等多层次体验;最后,日英双语开发模式为跨文化研究奠定基础。实践层面,VOXI可直接用于评估TTS语音系统优化、语音助手人格设计等应用场景。

未来研究需在三个方面深化:扩大样本验证量表的跨文化适用性,开发精简版(VOXI-S)提高实用性,以及探索与客观指标(如语音频谱特征)的关联机制。正如研究者强调,VOXI不应视为终点,而是推动语音交互研究从"零散测量"走向"系统科学"的重要起点。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号