编辑推荐:
在人工智能和算法辅助决策的背景下,为探究任务客观性、时间压力和认知负荷对算法信任(algorithmic trust)的影响,研究人员通过问卷调查和行为实验,发现任务客观性正向影响算法信任,时间压力显著影响算法建议采纳,认知负荷影响不显著,为优化算法交互设计提供理论依据。
在当今数字化时代,人工智能(AI)可谓无处不在,它就像一个神通广大的 “智能助手”,渗透到人们生活和工作的各个角落。从日常购物时的个性化推荐,到医疗领域辅助医生进行疾病诊断,再到自动驾驶技术保障出行安全,AI 算法凭借强大的数据处理能力,在处理大规模数据集和复杂问题时展现出超越人类决策的优势。然而,这个 “智能助手” 却面临着一个尴尬的处境 —— 人类对它的信任度并没有想象中那么高。
在教育领域,自动作文评分系统 E - Rater 虽能快速打分,但可能延续训练数据中的种族和性别偏见,这不仅加剧了社会不平等,还让公众对其信任大打折扣。在医疗场景中,尽管 AI 在疾病预防、营养指导和治疗优化方面潜力巨大,可患者对 AI 生成的建议信任度,远低于来自人类临床医生的相同建议。这些现象都表明,深入了解算法信任形成的认知机制迫在眉睫,只有这样,才能制定出更有效的策略,促进人机在不同任务环境中的协作。
为了揭开算法信任的神秘面纱,西南大学的研究人员展开了一系列研究。他们通过综合运用问卷调查和行为实验的方法,深入探究任务客观性、时间压力和认知负荷对算法信任的影响。研究成果发表在《Computers in Human Behavior Reports》上,为该领域的发展提供了重要的理论支持。
研究人员采用了多种关键技术方法。在样本选取上,研究 1 通过 Credamo 平台招募了 488 名参与者,研究 2 从 67 名大学生中筛选出 51 名,研究 3 则招募了 54 名参与者。在实验设计方面,研究 1 借鉴已有研究,用 0 - 100 的量表评估 25 个决策任务的客观性、算法熟悉度和信任度;研究 2 改编算法委托范式,利用字母记忆任务操纵认知负荷,通过设置决策响应窗口控制时间压力,并采用 WOA(weight of advice,建议权重)和决策信心作为衡量算法信任的指标;研究 3 基于研究 2 的结果,重复实验过程,重点验证时间压力的影响 。
研究 1:任务客观性对算法信任的影响
研究人员让参与者对 25 个算法决策任务进行评估,结果显示这些任务的客观性评分差异显著。“分析数据”“驾驶汽车”“估计体重” 等任务被认为客观性较高,而 “创作歌曲”“预测笑话有趣程度”“推荐恋爱对象” 等任务主观性较强。在对算法建议的信心方面,参与者在高客观性任务中更倾向于信任算法决策,如 “分析数据” 和 “预测天气” 任务。不过,在 “估计体重” 任务中,参与者对人类和算法决策的信任度没有明显差异。进一步的相关性分析和逐步回归分析表明,任务客观性与算法信任呈显著正相关,是影响算法信任的重要因素。
研究 2:认知负荷和时间压力对算法信任的影响
为确保实验的有效性,研究人员首先对认知负荷操纵的效果进行检验。通过独立样本 t 检验发现,高认知负荷组在字母识别任务中的反应时间显著长于低认知负荷组,而准确率无显著差异,这表明认知负荷操纵成功。接着,研究人员进行 2?3 混合方差分析(ANOVA),结果显示:在决策时间方面,时间压力有显著影响,无时间压力与高、低时间压力条件下的决策时间差异显著;在 WOA 方面,时间压力的主效应显著,无时间压力与高、低时间压力条件下的 WOA 差异显著;在决策信心方面,时间压力的主效应显著,低时间压力下对算法的决策信心最高。此外,研究还发现时间压力与信任类型(客观 WOA 和主观决策信心)存在显著交互作用,随着时间推移,时间压力下算法信任在客观和主观指标上呈现动态变化。
研究 3:时间压力对算法信任的影响
研究 3 再次验证了时间压力对算法信任的影响。通过单向重复测量 ANOVA 分析发现,时间压力对 WOA 和决策时间有显著影响,但对决策信心无显著影响。进一步分析还发现,信任类型和时间压力之间存在显著交互作用,这进一步证实了时间压力对算法信任的动态影响。
综合以上研究,研究人员得出结论:任务客观性对个体的算法信任有显著正向影响,人们在高客观性任务中更倾向于信任算法。时间压力在高客观性决策任务中是影响个体接受算法建议的关键因素,它能促使人们在决策时更多地依赖算法,但在决策后可能会重新评估,导致对算法的信任度下降。而认知负荷在高客观性决策任务中对算法建议的采纳没有显著影响。
这项研究意义重大,它揭示了任务特征和情境因素影响用户算法信任的认知机制,强调了算法信任的情境依赖性,为开发者优化算法交互设计提供了理论基础。不过,研究也存在一些局限性,如认知负荷效应不显著可能受时间压力上限效应影响,样本局限于中国大学生,未充分考虑个体差异等。未来研究可从拓展任务范式、开展跨文化研究、纳入更多个体差异因素、收集定性数据、进行纵向研究以及探究风险感知和算法能力等维度因素入手,进一步深入探索算法信任的奥秘,推动人机协作在更多领域的高效发展。