在二进制决策任务中，预测人类与人工智能协同决策过程中的人类信任决策

首页今日动态人才市场新技术专栏中国科学人云展台
BioHot
云讲堂直播会展中心特价专栏技术快讯免费试用

生物通官微
陪你抓住生命科技
跳动的脉搏

生物通首页 > 今日动态 > 正文

《International Journal of Industrial Ergonomics》：Predicting human trust decisions during Human-AI collaborative decision-making in binary decision tasks

【字体：大中小】 时间：2026年03月27日 来源：International Journal of Industrial Ergonomics 3

编辑推荐：

　　本研究针对高风险场景中人类对AI决策支持系统的信任决策问题，提出融合自我信心与AI信心评估的动态贝叶斯概率模型，结合期望效用理论构建预测框架，通过随机点运动实验验证，平均预测准确率达90.9%，为优化人机协作中的信任校准提供理论支持。

宋丁|潘星|胡伦虎|曲庆星

中国沈阳东北大学商学院

摘要

人工智能（AI）技术的普及推动了人机协作决策的显著进步。特别是在高风险决策场景中，当AI作为决策支持系统使用时，人类对AI建议的错误接受或拒绝可能导致灾难性后果。在这个问题中，信任在塑造人类是否接受AI建议的决策中起着关键作用。因此，预测人机协作决策中的人类信任决策至关重要。为了解决这一差距，我们开发了一个信任决策实验，并提出了一种新的贝叶斯概率建模方法，该方法结合了对自身和AI的信心。基于这一框架，我们进一步应用期望效用理论来预测人类信任决策。结果表明，我们的方法有效地捕捉了人类在连续决策过程中对AI信心的个性化动态，并在预测人类信任决策方面取得了令人满意的性能，平均准确率为90.9%。这些发现为人机协作决策中的信任校准提供了宝贵的基础。

引言

人工智能（AI）系统可以从大规模数据中提取与人类关切相关的信息，并越来越多地被用于支持医疗保健（Ammeling等人，2025年）、军事（Hung和Givigi，2016年）和商业（Gupta等人，2022年）等领域的决策。通过补充人类的认知和计算能力，AI可以提高效率和安全性和减少工作量（Veitch和Alsos，2022年）。然而，有效的人机协作严重依赖于适当的人类信任（Westphal等人，2023年）。由于信任并不总是与AI的实际能力一致（Sheridan和Parasuraman，2005年），不适当的信任会损害性能甚至危及安全（Hoff和Bashir，2015年）。因此，信任校准对于减轻误用（过度信任）、不用（信任不足）和滥用（不适当的应用）（Parasuraman和Riley，1997年）至关重要。开发一种定量方法来预测人类信任决策是克服这一挑战的必要步骤。

信任包括两个维度：信任水平和信任决策。大多数文献使用“信任”特指信任水平，本研究也遵循这一惯例。信任的概念受到了来自不同学术范式的学者的广泛关注。尽管具体定义存在差异，但这些定义通常包括信念、对不确定性的预期、可靠性、能力或态度（Gulati等人，2024年）。信任决策是指个体接受或拒绝AI建议的决策过程，这一过程受到他们信任水平的影响。

信任通常被认为是一个在[0,1]区间内的连续变量，并且根据经验动态更新（Chang等人，2010年）。这种动态更新过程嵌套在一个更大的闭环系统中，通过这个系统，信任影响我们对AI的信任决策，即人类选择接受还是拒绝AI的建议，然后这一信任决策的结果又反馈到对AI能力的信念中，使循环继续（Lee和See，2004年）。为了量化信任，研究人员开发了各种模型，这些模型利用了来自社会心理学视角（HU等人，2018年）（DING等人，2025年）或概率统计视角（Chen等人，2018年；Xu和Dudek，2015年）的实验方法和建模技术。

尽管对人类与AI之间信任的研究日益受到关注，但信任决策形成的机制仍不清楚。这可能归因于以往研究中使用的信任定义多样化且抽象，这些定义主要关注信任本身而非信任决策。尽管如此，关于信任的研究提出了一个基本问题：人类是如何形成信任决策的认知过程？直观地说，在信任决策中，人类将自己的决策与AI的决策进行比较以选择最佳选项（Bhat等人，2022年）。Guo等人的工作也强调了这一点（Guo等人，2024年）。更具体地说，这一决策过程包含了两种不同类型的信心：自我信心，反映了个体对自己做出正确决策的能力的信念；以及对AI的信心，反映了人类对AI生成的建议的可靠性的期望（Chong等人，2022年）。因此，本研究的主要目标是探讨自我信心和对AI信心的演变如何决定信任决策，旨在初步探索信任决策背后的机制。

事实上，人类在做出每个选择时都会有一种信心感，这是一种影响他们决策的主观感受。认知科学研究表明，人类通过感知呈现给他们的证据的不确定性来评估其感知决策的准确性（Ernst和Banks，2002年），从而做出决策。一般来说，证据的不确定性决定了任务的难度；不确定性越高，任务越困难（Pan等人，2024年；Hu等人，2022年）。相应地，人类报告的决策准确性越低。一个普遍接受的学术观点认为，人类对决策的信心是对决策正确性的概率的预测（Hangya等人，2016年）。在计算层面，一个较新的流行观点认为，信心是基于贝叶斯规则生成的（Fleming和Daw，2017年；Meyniel等人，2015年；Aitchison等人，2015年）。根据这些理论，信心被定义为正确的后验概率的函数，这将信心直接与决策所基于的证据的质量联系起来。最近一项关于信心神经机制的研究为这一观点提供了初步支持（Geurts等人，2022年）。因此，在二元决策中，个体的信心水平可以从50%（表示完全不确定性）到100%（表示绝对确定性）不等，这取决于可用证据的强度和清晰度。

然而，在人机协作决策中，人类不仅计算自己对决策的信心，还计算AI做出的决策的信心。与评估自己决策的信心相比，评估对AI的信心更具挑战性，因为它需要考虑任务难度和AI的能力。之前的研究探讨了信心演变如何影响与AI建议互动时的决策（Chong等人，2022年）。然而，通过主观报告获得的信心数据可能存在校准误差和响应偏差。关于信心的研究也集中在信心本身及其背后的神经机制上（Lisi等人，2021年；Kepecs等人，2008年）。据我们所知，从人类信心的角度准确预测信任决策的研究非常有限，且结果并不令人满意。

总的来说，上述研究为信任建模和人类在决策中的信心提供了重要的见解。然而，现有文献在信任决策建模方面仍存在差距。首先，现有工作主要集中在建模信任水平上，而不是直接预测信任决策。其次，尽管之前的研究已经考察了人类的信心和信任，但对于如何在人机协作中整合对自己和AI的信心以产生具体的信任决策的理解仍然有限。大多数现有工作侧重于拟合信心的主观报告或信任，而不是阐明导致人类接受或拒绝AI建议的决策形成过程。此外，任务难度、人类能力和AI能力通常被分开处理，而不是整合在一个统一的计算框架内，这使得将这些模型应用于现实世界环境变得困难。同时，许多决策支持研究主要强调提高或报告AI的预测准确性。然而，仅凭准确性并不能说明人类对AI的依赖是否适当。重要的是，高AI预测准确性本身并不能保证人类对AI的依赖是适当的，因为用户在不确定性下仍可能过度依赖或依赖不足。

为了填补这一研究空白，我们的论文提出了一个旨在预测人类信任决策的动态模型。换句话说，本研究解决了人机协作中最全面的场景之一，涉及带有AI辅助决策的二元决策任务，其中人类决定是否接受或拒绝AI的建议。

本研究的动机是预测人机协作过程中人类的信任决策，如图1所示。具体来说，首先，我们提出了一个统一的贝叶斯框架，该框架整合了任务难度、人类能力和AI能力，以模拟连续二元决策任务中的人类自我信心和对AI的信心。其次，通过整合期望效用理论，我们制定了一个具体的信任决策模型，该模型可以逐次预测人类操作员是接受还是拒绝AI的建议。第三，我们使用来自受控随机点运动实验（Newsome等人，1989年）的行为数据来实证验证所提出的模型，评估其在预测准确性、个体层面参数估计以及捕捉信任决策随时间动态变化方面的性能。

实现这些目标具有重要的理论和实践意义。从理论角度来看，所提出的方法提供了一个原则性的计算框架，解释了信心动态如何产生信任决策，从而推进了人机协作中的决策级建模。从实践角度来看，逐次预测人类信任决策可以为设计和评估安全关键的人机协作环境中的自适应AI系统提供信息。

本文的其余部分组织如下：第2节详细介绍了实验协议和信任决策模型的构建。第3节展示了实证发现并分析了收集的数据。基于这些结果，第4节讨论了其解释，指出了论文的局限性，并提出了未来的研究方向。最后，我们总结了主要发现和贡献。

部分摘录

方法

所提出方法的思想和框架如图2所示。在本节中，应用了随机点运动（RDM）任务和对自我及AI的信心计算模型，以理解在AI辅助决策场景中人类对AI建议的信任决策。在连续决策任务中，RDM任务旨在根据AI的表现来指导人类对AI信心的变化。开发了计算模型来捕捉这种动态量化

行为数据的统计分析

为了提供一个紧凑的实证概述，表4总结了不同AI准确性条件下的平均信任率、选择准确性和反应时间。接下来，我们使用模型派生的量来进行统计分析，将任务难度、信心和反应时间联系起来。

实验1获得的数据捕捉了决策信心、任务难度和选择准确性之间的关键定性关系。具体来说，随着

θ

的增加，

讨论

在这项研究中，我们提出了一种使用人类对自我和AI的信心来客观预测人类是否接受AI建议的方法。该方法在我们的实验数据集上取得了满意的结果。我们将从以下三个方面进行讨论：（1）人类信心；（2）所提出方法与其他现有方法的优越性；（3）局限性和未来工作。

结论

本研究开发了一种个性化的建模方法，用于预测人机协作二元决策任务中的人类信任决策，该方法基于贝叶斯决策理论和期望效用理论。建立了一个概率模型，整合了人类自我信心和对AI的信心，以表征和预测信任行为。所提出的方法通过涉及21名参与者的实验得到了验证，包括人类自我决策和人机协作

CRediT作者贡献声明

宋丁：撰写——原始草案、方法论、数据管理。潘星：监督、项目管理、资金获取、概念化。胡伦虎：撰写——审稿与编辑、方法论、形式分析、概念化。曲庆星：可视化、验证、调查。

利益冲突声明

作者声明他们没有已知的财务利益或个人关系可能影响本文报告的工作。

致谢

本工作得到了国家自然科学基金的支持，资助编号为72071011/No.72561024。

联系信箱：

粤ICP备09063491号

摘要

引言

部分摘录

方法

行为数据的统计分析

讨论

结论

CRediT作者贡献声明

利益冲突声明

致谢

热点排行