《Communications Psychology》:AI outperforms humans in establishing interpersonal closeness in emotionally engaging interactions, but only when labelled as human
编辑推荐:
本研究针对人工智能(AI)能否建立人际亲密关系这一前沿问题,通过两项双盲随机对照试验,采用改良版"快速交友程序"(Fast Friends Procedure)比较AI与人类在情感交流中的表现。研究发现,当被标记为人类时,AI在深度交流中通过更高水平的自我表露(self-disclosure)显著优于人类建立亲密关系;而明确标注AI身份会降低参与动机和亲密感。该研究为AI在心理健康等领域的应用提供了重要依据,同时警示了AI冒充人类的风险。
随着大型语言模型(Large Language Models, LLMs)的快速发展,人工智能(Artificial Intelligence, AI)在社会交往中的角色日益重要。近年来,人们与AI的社交互动体验发生了根本性变化。有证据表明,在某些情境下,LLM生成的内容不仅能够模拟人类交流,甚至可能超越人类表现。例如,参与者往往认为LLM生成的内容比人类更具同理心,特别是在不知其非人类来源的情况下。这一发现激发了学术界对AI在治疗环境中应用潜力的探索。
然而,一个关键问题尚未得到解答:在与先前陌生的对象建立新关系的早期阶段,人类与AI建立关系的程度是否与人类之间相当?特别是在被认为是"人类独有"的情感领域,AI是否能够胜任表面性的寒暄(small-talk)与涉及个人意义和情感话题的深度交流(deep-talk)?此外,现有理论往往忽视了人们对AI态度的影响。随着AI社交能力的进化,对交互式技术设备的担忧和保留态度也在同步增长。许多人对AI持负面态度,认为其不自然甚至具有威胁性。这种怀疑论反映在关于AI可能取代人类独特社会情感和认知能力的激烈媒体辩论中,形成了一个悖论:尽管与AI交流可以促进关系建立,但一旦人们意识到自己正在与AI互动,这些效果似乎就会消散。在考虑临床和心理治疗环境的可能应用时,这种对机器交互的负面态度变得有问题,因为必须道德地揭示交流来源。因此,理解如何标记交流来源(作为AI或人类)如何影响关系建立至关重要。
针对这一研究空白,Tobias Kleinert、Marie Waldschütz等研究人员在《Communications Psychology》上发表了最新研究成果。他们通过两项预先注册的双盲随机对照研究,考察了在与AI和人类的社会情感互动中关系建立的差异,以及互动的情感强度(寒暄与深谈)和内容来源的标签(标记为人类与标记为AI)对其的调节作用。
为了开展这项研究,研究人员招募了492名18至35岁的异性恋大学学生,专注于同性别个体间友好、非浪漫的关系建立。参与者参与了一项基于文本的在线版"快速交友程序"(Fast Friends Procedure, FFP),该程序旨在通过一系列轮流提问中逐步增加的相互自我表露,在两个陌生的互动伙伴之间引发人际亲密感。研究人员特别选择了FFP,因为它被设计用于在先前不熟悉的伙伴之间关系建立的早期阶段快速发展人际亲密感,这正是本研究关注的焦点。
在参与者不知情的情况下,对FFP项目的回应是预先生成的,这些回应要么来自一个最小化提示的LLM,要么来自在实验室环境中执行FFP的人类互动伙伴。研究人员提示AI从虚构角色的角度进行回应,而不是以其原始形式回答,以便使其能够回答个人问题,并保持基本角色信息(姓名、年龄、居住地、学习领域)与人类伙伴一致。关系建立通过自我报告的对互动伙伴的感知人际亲密感来操作化。此外,研究人员应用探索性的自动化语言分析,使用语言查询与词计数系统(Linguistic Inquiry and Word Count, LIWC-22)来调查关系建立中任何已识别的条件间差异是否可以通过互动伙伴(即AI生成的角色或人类)和/或参与者的自我表露水平差异来解释。
研究一采用2x2被试间设计,考察"来源身份"(人类互动伙伴 vs. AI生成的虚构角色)和"情感强度"(寒暄 vs. 深谈)对人际亲密感的影响。所有研究一的参与者均被告知将与人类互动,这对于实际与AI互动的两个处理组而言是一种欺骗。研究二重新分析了研究一的部分数据以及为研究二收集的其他数据,采用另一个2x2被试间设计,聚焦于深谈互动,考察"来源身份"(来源人类 vs. 来源AI)和"来源标签"(标签人类 vs. 标签AI)的影响。
研究发现,当被标记为人类时,AI在情感投入的深度交流中建立亲密感的能力超越了人类。这种显著效应似乎源于AI更高水平的自我表露,这反过来增强了参与者的亲密感感知。将伙伴标记为AI降低但并未消除关系建立,这可能是由于参与者与AI互动的动机较低,反映在更短的回应和减少的亲密感上。这些发现凸显了AI在减轻过度负担的社会领域(如心理治疗)压力的潜力,同时强调了迫切需要制定伦理保障措施以防止其被滥用于培养欺骗性的社会连接。
关键技术方法
本研究采用双盲随机对照试验设计。通过在线修改版"快速交友程序"(FFP)诱导人际亲密感。人类回应来自实验室环境中的真实互动,AI回应则使用PaLM 2模型生成。使用语言查询与词计数系统(LIWC-22)进行自动化语言分析,量化自我表露水平。人际亲密感主要通过包含他人自我量表(Inclusion of Other in the Self Scale, IOS)测量。数据分析采用层次线性模型和协方差分析。
研究结果
AI在情感深度交流中超越人类建立亲密关系
作为研究一的基础分析,研究人员首先检验了在伪装互动中(即互动伙伴被标记为人类),人际亲密感是否有所增加。重复测量层次线性模型分析显示,在人类标记的AI互动中,无论是跨深谈和寒谈条件,还是各自条件内,从互动前到互动后测量的亲密感均出现统计学显著增加。正如预测的那样,与AI的深谈互动显著增加了人际亲密感,证实了假设1。作为比较,分析发现与人类的互动同样导致了亲密感的显著增加。等效性检验后的贝叶斯t检验显示,当针对小到中等效应量的存在进行检验时,人类和AI互动在跨情感强度水平上的亲密感增加差异实际上可以忽略不计。
作为研究一的主要分析,研究人员通过运行协方差分析比较了FFP互动后测量的人际亲密感。虽然"来源身份"和"情感强度"的主效应均不显著,但发现这两个变量之间存在统计学显著的交互效应。事后检验显示,在深谈条件下,与AI互动后的亲密感高于与人类互动后的亲密感,而在寒谈条件下,亲密感则无统计学显著差异。令人惊讶的是,研究结果既没有提供证据表明与人类的互动比与AI的互动产生更强的亲密感,也没有证据表明深谈互动比寒谈互动产生更强的亲密感。因此,假设2和假设3被拒绝。而且,与假设4相反,AI互动产生了比人类互动更强的亲密感,但这仅发生在深谈条件下,而非寒谈条件下。
为了进一步探究为何人们在深谈互动后对AI感觉更亲近,研究人员测试了AI生成的回应在自我表露方面是否与人类生成的回应不同。方差分析显示,AI生成的回应表现出比人类生成回应高得多的自我表露水平。接下来,通过偏相关分析控制年龄和性别后,发现当互动伙伴的回应显示出更高水平的自我表露时,参与者感觉与他们的互动伙伴更亲近。
研究人员随后测试了参与者自身的回应在与AI互动和与人类互动之间是否存在差异。协方差分析表明,参与者在与AI互动时表现出更高水平的自我表露。然而,参与者自身的自我表露与他们在深谈互动中感知到的亲密感没有显著关联。最后,分析发现互动伙伴回应中表现出的自我表露程度与参与者自身的自我表露呈正相关。
对AI的信念是否阻碍关系建立
在研究一的基础上,研究二首先检验了被告知将与AI互动是否会阻止关系建立。重复测量层次线性模型分析显示,当参与者被告知将与AI互动时,无论是他们实际与AI互动还是实际与人类互动,亲密感均出现统计学显著增加。这些发现表明,即使参与者被告知他们正在与AI互动,关系建立仍然会发生,支持了假设5。作为比较,分析发现当参与者被告知将与人类互动时,亲密感也出现显著增加。
作为研究二的主要分析,研究人员通过运行协方差分析比较了AI标记和人类标记互动后的亲密感。分析揭示了"来源标签"的显著主效应,AI标记互动后的人际亲密感较低,但"来源身份"的主效应不显著,交互效应也不显著。这些结果再次没有提供证据表明参与者与人类互动伙伴建立的亲密感强于与AI互动伙伴。因此,假设6被拒绝。正如预期,将互动伙伴标记为AI导致互动后的人际亲密感评分低于伙伴被标记为人类时,证明存在反AI偏见,并证实了假设7。假设8被拒绝,因为没有发现人类互动后与AI互动后的人际亲密感差异存在证据。
由于参与者在人类标记和AI标记条件下接收到来自相同人类或AI互动伙伴的回应,人际亲密感的差异不能归因于伙伴回应的变化。研究人员因此以探索性的方式测试了人们自身与AI标记伙伴的交流是否与人类标记伙伴不同。事实上,虽然在自我表露方面没有显著的组间差异,但人们在假设将与人类互动时写的回应明显更长。反过来,更长的回应也与更高水平的感知亲密感相关。因此,AI标记的互动导致参与者回应急剧缩短和感知亲密感水平降低。
研究发现证据表明,即使意识到与人工代理互动,个体也会与AI形成社会纽带,但也观察到反AI偏见导致互动后的亲密感低于人类标记互动。为了探究为何有些人会与AI形成社会纽带而有些人不会,研究人员检验了重视自然人类交流的个体是否更持AI怀疑态度。事实上,发现"来源标签"与普遍主义价值观在预测人际亲密感上存在显著的交互效应。这一效应是由人类标记互动中普遍主义与亲密感之间的正相关所驱动,而这种关联在AI标记互动中不存在。这些发现表明,个人价值观可能调节与AI的关系建立。
研究结论与意义
研究表明,人类确实会与AI创造的虚构角色建立关系。引人注目的是,在情感投入的深度交流中,AI生成的内容在建立亲密感方面优于人类生成的内容。后续分析表明,AI回应在情感互动中表现出更高水平的自我表露,这反过来又引发了参与者更高水平的自我表露和感知人际亲密感。明确告知将与AI互动会导致反AI偏见,这降低但并未阻止关系建立。这种效应可能是由于参与者与AI互动的动机较低,这反映在更短的回应和报告的较低亲密感水平上。
本研究的关键创新之一在于直接比较了人机关系建立与人际关系建立。研究结果不仅强调了AI在情感交流中的卓越能力,也揭示了其通过更高自我表露帮助人类感到更舒适地敞开心扉的潜力。然而,AI的卓越表现仅在伪装成人类生成内容时出现,而这在日常应用中并非如此。与最近表明将内容标记为AI生成会降低其积极感知的研究一致,参与者在被告知将与AI互动时报告的人际亲密感较低。这并不奇怪,因为人类通常更喜欢人类伙伴而非AI伙伴,尤其是在通常被认为是独特"人性"的领域,如情感互动。
这些发现凸显了对话式AI作为强大工具和潜在社会风险的双重角色。一方面,AI在减轻心理治疗、医疗护理和老年护理等过度负担的社会领域的压力方面显示出巨大前景。为了促进这些领域的接受度,建议采用透明的人工引导介绍、持续监控以及系统评估人机互动。另一方面,结果强调了AI被滥用于通过培养欺骗性情感连接进行操纵的风险。因此,明确的伦理准则和保障措施对于确保对话式AI被负责任地利用并造福社会至关重要。
该研究也存在一些局限性,例如未来研究可以探索实时互动中与AI的关系建立,使用更少结构化的互动以提供更大的生态效度,以及考察AI关系的长期可持续性。尽管存在这些局限,研究结果为理解人机互动的动态提供了重要见解,并为AI在社会中的负责任整合指明了方向。