首页今日动态人才市场新技术专栏中国科学人云展台
BioHot
云讲堂直播会展中心特价专栏技术快讯免费试用

生物通官微
陪你抓住生命科技
跳动的脉搏

生物通首页 > 今日动态 > 正文

并发游戏中的合作动态

【字体：大中小】 时间：2025年02月12日 来源：Nature Communications

编辑推荐：

　　Rossetti和合作者探索了当玩家同时参与多个经济游戏，而不是将每个游戏视为孤立的游戏时，人类合作动态是如何变化的。作者发现，在这种情况下，认知约束、战略动机和溢出效应会减少合作，挑战传统的直接互惠模型。

并发博弈中合作动态的深度解析：打破传统认知，揭示复杂互动规律

在当今复杂的社会环境中，人们的互动模式丰富多样，多个互动场景常常并行发生。在这样的背景下，德国马克斯?普朗克进化生物学研究所的 Charlotte S. L. Rossetti、英国埃克塞特大学的 Oliver P. Hauser 以及来自德国马克斯?普朗克进化生物学研究所的 Christian Hilbe 合作开展研究。他们的研究成果《Dynamics of cooperation in concurrent games》发表于Nature Communications期刊。这一研究意义重大，它突破了传统直接互惠研究仅聚焦孤立重复博弈的局限，构建起新的理论框架，为深入理解现实中人们的合作行为提供了关键视角，对经济学、社会学、生物学等众多学科中合作行为的研究产生深远影响。

论文摘要指出，人们在生活中经常面临个人最优决策与群体利益冲突的情况，常采用基于直接互惠的简单启发式策略应对。但以往研究多假设个体一次仅参与一个博弈，现实中个体往往同时参与多个博弈，且不同博弈结果相互影响。本研究引入理论框架探究这种交叉和溢出效应，参与者重复进行两个独立阶段博弈，通过进化学习过程调整策略。研究发现个体常将不同博弈中的行为联系起来，尤其是在认知受限情况下，并发博弈会对合作产生负面影响，凸显了战略动机和溢出效应对互惠的影响。

从研究背景来看，直接互惠是促进非亲属间合作的核心机制，在邻里互助、学生互评、夫妻分担家务等场景中广泛存在。实验表明，当互动重复且再次相遇概率足够高时，互惠关系会自然形成。个体可依据对方过去行为调整当前行动，采用如 Tit-for-Tat 等条件合作策略，能促使自私对手合作。运用进化博弈论模型，研究者对何种策略会进化以及互惠合作在何种环境下稳定进行了大量探索。然而，大多数研究存在局限性，通常假设个体一次仅参与一个重复博弈，或把每个博弈视为独立的，这种独立性假设虽便于理论分析，但与现实不符。当放弃这一假设后，玩家策略不再仅取决于当前博弈中对手的先前行动，还可能与所有博弈中对手的先前行动相关，研究视角需从标准博弈转变为群体视角，这大大增加了模型的计算复杂性。多数研究基于单独分析不同博弈就能推断人们在多博弈并行时行为的假设开展，本研究旨在验证这一假设的合理性。

研究人员通过构建理论模型并开展行为实验进行研究。在理论模型方面，以捐赠博弈为基础构建并发博弈模型，设置了三种理想化场景（处理方式）。控制组中，参与者一次仅参与一个重复博弈，分别进行高收益或低收益博弈；同伙伴组中，参与者与同一伙伴同时进行两个重复博弈；不同伙伴组中，参与者同时进行两个重复博弈，但分别与不同伙伴进行。参与者采用反应性策略决策，通过马尔可夫链计算参与者收益，并运用内省动态模拟策略更新过程。在行为实验方面，从埃克塞特大学学生群体招募 316 名参与者，实验经伦理委员会批准。参与者被随机分配到三种处理方式中，在捐赠博弈基础上设定高、低收益博弈的收益值，实验至少进行 20 轮，之后每轮有 50% 的概率继续进行，参与者可获参与报酬和基于决策的奖金。研究人员使用两尾非参数检验和统计回归分析数据，以交互对或交互组为统计单位。

具体来看研究结果。在并发博弈模型构建上，研究人员以捐赠博弈为基础，设定两种收益情况构建高收益博弈和低收益博弈。控制组中，参与者一次进行一个重复博弈；同伙伴组和不同伙伴组中，参与者同时进行两个重复博弈。通过定义不同处理方式下的反应性策略，明确了策略与博弈独立性的关系。利用马尔可夫链计算收益，采用内省动态模拟策略更新，为后续研究奠定了模型基础。

模拟学习动态时，固定参数模拟三种处理方式下的学习动态，结果显示控制组结果与以往直接互惠研究一致，重复互动使参与者实现一定程度合作，高收益时合作更多。同伙伴组中个体在两个博弈中频繁合作，不同伙伴组合作率持续较低。这表明博弈间的关联影响合作动态，在同伙伴组中这种影响有利于合作，在不同伙伴组中则不利。进一步记录合作参与者策略发现，控制组中合作参与者采用类似慷慨 Tit-for-Tat 策略；同伙伴组中参与者仅在对方两个博弈均合作时才充分合作，表现出明显的博弈间关联；不同伙伴组中参与者在两个博弈中同时合作的可能性低，关联较弱。

研究还发现，上述定性结果具有稳健性，不依赖于合作的具体收益、参与者是否犯执行错误、博弈是否无限重复以及内省学习过程中选择参数的强度。并且，该框架可扩展到不同类型的阶段博弈场景，如将低收益博弈替换为囚徒困境、雪堆博弈或协调博弈时，不同处理方式间仍存在显著差异，除协调博弈外，同伙伴组往往产生最大收益。

在纳入认知约束和不同学习启发式方面，研究人员在模型中引入了四种可能影响并发博弈行为的认知约束和启发式进行研究。在不完美回忆方面，假设参与者以一定概率混淆过去博弈结果，结果显示这种错误在不同伙伴组对合作有微弱负面影响，在同伙伴组反而强化合作，因为错误促使参与者更倾向于仅在对方两个博弈都合作时才合作。在外生行为溢出方面，溢出增加了参与者在两个博弈中选择相同行动的概率，在不同伙伴组对合作有微弱负面影响，在同伙伴组其影响正负取决于溢出频率，部分情况下会使合作率低于控制组。在优先更新方面，参与者可能更倾向于更新收益较小博弈的策略，模拟显示这在不同伙伴组有微弱积极影响，在同伙伴组中，高收益博弈合作增加，低收益博弈合作不稳定。在窄框架方面，参与者在更新一个博弈策略时未充分考虑对另一个博弈的影响，在不同伙伴组影响不明显，在同伙伴组则削弱合作。

行为实验结果表明，人们在控制组中合作性最强，与基线模型预测不同，但与部分模型扩展结果相符。在高收益博弈和低收益博弈中，控制组合作率均高于同伙伴组和不同伙伴组。分析参与者反应性策略发现，同伙伴组中参与者行为关联更明显，不同伙伴组关联较弱，但两组整体合作率均低于控制组。

综合来看，研究结论表明，人们在日常多博弈场景中，实际行为与传统直接互惠研究中假设的博弈独立性不符，个体常将不同博弈行为联系起来，尤其是在同伙伴博弈场景中。该研究构建的理论框架可有效纳入多种认知约束和学习启发式，扩展了直接互惠模型的研究范围，使研究更贴近现实。行为实验显示并发博弈会降低合作率，与理论预期存在部分差异，可能源于参与者对单博弈和并发博弈的本质认知差异。这一研究对直接互惠理论模型发展意义重大，传统基于单一重复博弈的模型无法全面解释现实中的互惠互动，并发博弈中不同博弈间的关联使互惠利他行为的出现更为复杂。该研究成果为后续研究指明方向，未来可探索参与者同时参与更多博弈或收益波动时的行为，为多学科研究合作行为提供了新的理论依据和研究思路。

热点排行

新闻专题

联系信箱：

粤ICP备09063491号