生物决策的持续动态:跨物种比较与组织约束下的适应性行为机制

《Biological Reviews》:Continual decision-making dynamics across biological organisms

【字体: 时间:2025年12月28日 来源:Biological Reviews 11.7

编辑推荐:

  本综述创新性地提出持续决策动态(CDMD)框架,突破传统神经中心主义视角,将决策行为定义为由自我组织和自我调节相互作用维持的、具有时间延展性和历史敏感性的过程。该框架通过形式化建模揭示了分布式和去中心化系统中决策的动态机制,强调调控功能和历史约束(时间印记)在塑造跨系统发育尺度决策策略中的核心作用,为整合生物复杂性与认知建模提供了新范式。

  
ABSTRACT
决策是生物体适应性行为的核心功能,但不同物种的决策策略存在显著差异。本文旨在通过引入持续决策动态(Continual Decision Making Dynamics, CDMD)框架,将决策分析的范围扩展到系统发育多样性的生物体中。CDMD将决策描述为一个时间延展、历史敏感的过程,由自我组织和自我调节的相互作用维持。通过实证案例,我们展示CDMD如何适应支持更分布式和去中心化决策模式的控制架构组织,并促进跨系统发育和组织尺度的决策策略比较研究。
I. INTRODUCTION
决策被广泛认为是生物系统适应性行为的标志。然而,在认知和生命科学中,对决策的表征存在显著分歧,这阻碍了跨类群和组织水平评估决策能力的保守性。传统模型通常将决策视为基于证据积累、信息整合和评估过程从备选方案中选择行动,并假设决策能力本质上是基于“高阶”过程。近年来,形式化模型如贝叶斯决策、强化学习(Reinforcement Learning, RL)和漂移扩散模型已被应用于解析支持适应性决策的认知计算和神经机制。与此同时,行为生态学和进化生物学中的规范性模型提供了互补视角,将决策研究为受环境因素塑造的交互式适应性过程。
重要的是,来自非神经系统的证据挑战了许多关于决策的标准假设。例如,无细胞黏菌(Physarum polycephalum)、豌豆植物(Pisum sativum)和匍匐委陵菜(Potentilla reptans)等生物在缺乏神经元或大脑神经认知表征的情况下表现出决策样行为。这些观察结果表明,决策可能是一种进化上保守的能力,基本受生物组织约束。为了发展关于决策的综合视角,有必要弥合传统认知模型与生态和组织视角之间的概念差距,并将非常规模式生物的证据更明确地纳入决策研究。为此,我们提出CDMD模型,将分布式和去中心化系统中的决策动态重新框架为历史嵌入的调控功能。
II. THREE THEORETICAL CHALLENGES IN STUDYING DECISION-MAKING IN NON-NEURAL ORGANISMS
在研究非神经生物体决策时面临三个关键理论挑战:
(1) The granularity problem
决策一词在不同学科中被广泛使用,但指代的概念和分析单元可能存在根本差异。若定义过于宽泛,决策可能涵盖几乎任何形式的适应性反应,稀释其解释力;若定义过于严格,则可能引入选择偏差,忽视对决策的潜在洞察来源。我们提出一条中间路径,将决策视为一组基于组织基础、机制上特定的过程,依赖于系统的自我调节和历史依赖性动态。
(2) The representation problem
第二个挑战在于决策与认知表征模型之间的关联。以人类为中心的认知模型通常假设决策需要咨询和操作内部世界模型。然而,并非所有适应性选择都需要基于此类内部模型进行规划。非神经系统似乎依赖于分布式机制和反馈控制,而非内部模型或自上而下的结构,通过生物物理过程和原始认知机制利用环境结构来实现适应性决策样行为。
例如,无细胞黏菌(P. polycephalum)根据先前经验调整觅食模式,沉积化学梯度以映射环境线索的重复出现。豌豆植物通过卷须的定向回旋运动表现出 anticipatory 的决策样行为。这些案例挑战了表征主义假设,表明 anticipation 也作为分布式或去中心化系统的功能属性出现。
(3) Ambiguity in levels of organisation
第三个挑战涉及决策如何在多个生物尺度上运作。在神经系统中,决策被认为涉及证据积累和强化引导的行动选择的认知机制。在生物体的微观细胞尺度上,情况则完全不同。例如,攀缘植物中的局部结构整合多样环境反馈信号,以去中心化方式调整全局枝条/根系生长模式和形态结构,以维持生理完整性。区分这些决策案例需要一种对不同生物尺度的组织自主性敏感的概念框架。
III. A THEORETICAL APPROACH TO CONTINUAL DECISION-MAKING DYNAMICS
CDMD通过旨在解释决策的三个主要特征来解决上述挑战:其基于生物自我调节的基础(组织结构);其递归的、历史敏感的结构(时间结构);及其调控功能(调控转变)。
(1) Organisational grounding of decision-making
CDMD将决策视为系统状态之间的调控转变。系统状态 St不是内部或外部条件的简单快照,而是由先前提控修改塑造的动态配置。决策/行动(at)选择过程可以表示为函数 at= π(St, Et, Tt),其中 π 描述了系统如何基于其当前状态、环境背景和编码在时间印记中的历史印记来选择行动。
(2) Time-prints and embedded constraints
决策在生物系统中既是一个过程也是一个结果。为了形式化这一点,我们引入了时间印记(time-prints):历史嵌入的约束,调节未来的决策路径,而不需要明确的记忆表征。每个时间印记 Tt被定义为过去结果的累积函数:Tt+1= M(Tt, ot),其中 M 是记忆编码函数,基于新结果修改历史轨迹。
无细胞黏菌(P. polycephalum)的最佳觅食策略是历史印记的一个恰当例证。该生物通过以振荡方式扩展和收回搜索前沿来探索其环境,其生物质的更高效管状结构形成一个“化学图谱”,反映了系统的当前状态。这些细胞外黏菌轨迹既记录了过去状态,又通过排斥生物体远离已经采取的低效路径来主动影响未来选择。我们提出这些细胞外轨迹作为环境嵌入的时间印记(Tt)发挥作用,调控未来行动,而无需任何内部记忆存储。
(3) Regulatory function across levels of organisation
CDMD框架还通过将决策定义为稳定系统状态之间的调控转变,解决了与不同生物尺度决策相关的模糊性。这种方法阐明了细胞、有机体和集体水平上的组织动态如何支持决策,尽管其底层机制和功能可塑性不同。
欧椋鸟(Sturnus vulgaris)的 murmurations 是这一点的迷人例证。这种集体行为源于局部化互动,其中每只鸟基于其邻居的运动动态调整其速度和方向。群体的集体行为(St)已被充分记录,并被视为理解复杂系统涌现动态的典范。在这里,时间印记指的是群体内个体行动的历史印记,群体的先前状态(滞后作用)影响并塑造集体决策。
(4) Integrating state-dependent and process-dependent dynamics
CDMD中提出的观点捕捉了决策路径的持续重新调整。这里起作用的决策策略不仅由内部状态塑造,也由需要实时校准或调整的外部环境波动塑造。为了形式化这一点,我们引入了一个自适应景观函数 At,该函数基于过去结果递归演化:At+1= (1 - δ) * At+ ? * Ct,其中 δ 决定了先前结构条件的持续性,? 表示新结果重塑自适应空间的程度。
(5) Empirical predictions of CDMD
CDMD框架提供了明确指定的实证预测,可以在不同的生物模型系统中直接检验。具体而言,CDMD提出了三个可实证检验的预测:历史约束(预测1)、环境编码(预测2)以及历史与即时奖励的冲突解决(预测3)。这些预测可以通过实际操作实验设计进行检验,例如擦除黏菌轨迹、干扰根际分泌物或引入冲突激励。
IV. DISCUSSION
CDMD框架旨在广泛解释决策在生物系统的生化、生物物理和环境修改中的分布式处理,从而将决策功能视为一种嵌入式调控结构。因此,决策在时间上是连续的且具有路径依赖性。重要的是,这种表征允许在神经和非神经生物体之间进行比较性洞察,适用于从单细胞生物到多细胞集体的多样化例子。
CDMD与生态心理学和动力系统理论的考量相契合,这些理论在无需严格表征假设的情况下处理了适应性行为,更强调连续的生物体-环境互动。然而,CDMD框架在这些研究传统的基础上有几个重要方面的分歧。特别是,CDMD明确形式化了过去的生物体-环境互动如何约束未来的适应性可能性,将历史互动整合为对决策动态的约束,并嵌入到递归的适应性过程中。
重要的是不要过度推广CDMD。一个担忧是,根据CDMD的决策例子在某些情况下可能崩溃为更通用的适应性调控描述。为了防止这种情况,我们引入了三个明确的机制约束来定义CDMD框架下的决策。首先,决策必须由随时间累积、改变未来状态空间配置的不可逆历史约束塑造。其次,决策过程必须在行动选择中表现出灵活性,而不是遵循僵化的刺激-反应映射。最后,决策必须涉及在延长时间尺度上持续影响未来适应的历史敏感调控修改。
CDMD的一个更普遍的概念和方法论限制涉及模式生物在研究决策中的作用。重要的是,正如Levy & Currie所指出的,模式生物应与理论模型区分开来。虽然两者都被称为“模型”,但模式生物和理论模型产生知识的认识机制是不同的。理论建模者通过理论实践刻意设计和控制特征以镜像目标系统或现象,而模式生物是真实的生物实体,经过标准化和适应研究,尽管通常以其自身(常常不可预测的)术语存在。
CDMD的一个核心要求是能够做出可以通过实证检验证伪的独特实证预测。为了弥合这一差距,一种解决方案是采取一种实验性方法,探究生物体如何内部评估权衡,解决历史印记和即时需求之间的冲突,并灵活适应预测误差。在CDMD内,我们至少可以提出三个原则上可以被实证证据证伪(或支持)的合理假设。
V. CONCLUSIONS
(1) 我们解决了研究非神经生物体决策时的三个关键理论挑战:粒度问题、表征问题以及组织层次上的模糊性。
(2) 持续决策动态(CDMD)框架提供了一个形式化和综合性的决策模型,将其视为一个历史嵌入、组织基础且时间延展的过程。
(3) CDMD证明神经和非神经系统都可以通过分布式、去中心化和环境嵌入的调控机制支持决策,而无需明确的内部表征。
(4) 该框架整合了状态依赖和过程依赖的动态,使得能够跨系统发育和组织尺度对适应性行为进行比较分析。
(5) CDMD还提供了可实证检验的预测和操作标准,支持对历史和环境约束如何调节适应性决策进行实验研究。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号