
-
生物通官微
陪你抓住生命科技
跳动的脉搏
利用非公理推理系统(NARS)模拟任意适用关系反应(AARR):迈向机器心理学的人工通用智能新路径
【字体: 大 中 小 】 时间:2025年09月23日 来源:Frontiers in Robotics and AI 3.0
编辑推荐:
本综述创新性地将心理学中的关系框架理论(RFT)与人工智能领域的非公理推理系统(NARS)相结合,提出了一种名为“获得性关系”的机制,使NARS能够从感觉运动经验中直接推导符号化关系知识。文章通过理论推演证明,NARS可模拟人类核心认知现象——相互蕴涵、组合蕴涵和刺激功能转化,为构建具有人类式符号推理能力的人工通用智能(AGI)提供了理论基础。
人类智能的标志在于非凡的符号推理能力,即能够以灵活的方式理解和操纵符号及其关系。这种灵活性体现在无需直接训练、仅基于上下文关系即可推导符号间新关系的能力。在认知与行为心理学中,这一现象被概念化为任意适用关系反应(Arbitrarily Applicable Relational Responding, AARR),它是人类语言和高级认知的基础。AARR指的是习得的行为模式,即以任意方式关联刺激(不由刺激的物理属性决定,而是由上下文线索和社会学习决定)。例如,儿童一旦学会口语词“狗”指代实际的毛茸宠物,就会对词语做出反应,仿佛它在功能上等同于动物本身——听到这个词时体验到兴奋或快乐,类似于遇到狗本身。这种符号等价性不是由物理相似性决定,而是通过关系学习形成。
AARR是行为心理学中的一个概念,指一种普遍的学习行为模式:对刺激间关系而非刺激本身做出反应,且这种方式不由刺激的物理属性决定,而是由上下文线索和强化历史决定。这一思想是关系框架理论(Relational Frame Theory, RFT)的核心,RFT是一种现代行为理论,用于解释语言和认知。根据RFT,几乎所有人类语言和高级认知都建立在AARR之上——即能够沿不同维度(如相同、不同、大于、相反等)将不同刺激视为相关,纯粹是习得上下文的结果,而非因为它们物理特征中的任何内在关系。
AARR由三个关键属性定义,这些属性将其与简单联想学习区分开来:
相互蕴涵(Mutual Entailment):这是派生关系的双向性。如果一个人学会了一个方向的关系(例如A大于B),他们可以在没有直接训练的情况下推导出相反方向的关系(B小于A)。
组合蕴涵(Combinatorial Entailment):这是从多个已学关系的组合中推导新关系的能力。例如,如果学习了A与B相关,且B与C相关,通常可以推导A与C之间的关系,取决于关系的性质。
刺激功能转化(Transformation of Stimulus Function):这指的是刺激的功能(其意义、情感效价或行为效果)如何根据它们参与的关系而改变。换句话说,如果两个刺激以某种方式相关,附着于一个刺激的任何心理功能(如令人愉悦、具有特定名称、引发特定反应)可以根据其关系转移至另一个刺激。
非公理推理系统(Non-Axiomatic Reasoning System, NARS)是一种人工智能系统和认知架构,旨在实现一种在现实世界约束下有效运作的通用智能形式。“非公理”的名称反映了NARS不假设关于世界的预定义、完整公理集;相反,它必须非公理地学习和推理,意味着所有知识均从经验中获得,且总是可修订的。NARS建立在这样的认识上:现实世界中的智能主体必须应对知识不足和资源不足(王鹏称之为AIKR:知识与资源不足假设)。与在给定公理之外显得脆弱的经典逻辑系统不同,NARS是自适应的,随着新信息的到来不断更新其信念和策略,有些类似于人类持续学习和调整其理解的方式。
NARS的核心是一种称为非公理逻辑(Non-Axiomatic Logic, NAL)的AI推理框架。NAL是一种扩展了词项逻辑(一种处理词项或概念间关系的逻辑)的形式逻辑,且本质上是概率性的。NARS使用一种内部语言Narsese来表示知识。NARS中的所有知识片段都表示为Narsese中的语句,通常有主词和谓词以及连接它们的系词(系词定义主词与谓词之间的关系类型)。最简单的形式是继承关系“S → P”,意思是“S是P的一种”或“S在类别意义上蕴含P”。例如,“Tweety是一只鸟”可以表示为
至关重要的是,NARS中的每个语句都带有不确定性的度量。NARS不使用二元真值分配;相反,每条知识都有一个带两个参数的真值:频率(基于经验中关系为真的频率的类似概率的度量)和置信度(反映可用证据的数量)。这允许NARS在不确定性下进行推理,并在新证据到来时更新其信念。
NARS的另一个显著特征是其处理资源约束的方法。NARS实时运行,并有一个有限的“预算”用于注意力和内存。它不能一直考虑所有知识。相反,它使用优先级机制来决定接下来处理哪个任务(问题、目标、新知识),基于紧急性和相关性等因素。这确保了在任何给定时刻,系统都专注于最相关的信息,使其能够通过不被不太相关的细节拖累而扩展到更大的问题。
NARS的最近实现包括OpenNARS和一个称为OpenNARS for Applications (ONA)的变体。ONA是为集成到实际应用(包括机器人技术)中而定制的。它通过感觉运动能力扩展了基本的NARS框架,意味着它可以处理来自传感器的输入并发送输出到执行器(电机)作为其推理的一部分。这是通过将感觉运动事件也视为语言中的词项(例如,感官观察或电机命令可以是一个参与语句的词项)来完成的。在ONA中,推理引擎能够进行时间推理,理解事件序列和因果关系。
机器心理学是一个跨学科框架,它将学习心理学与自适应AI系统(如NARS)相结合,以探索人工代理中认知行为的涌现。这种方法系统地研究了日益复杂的学习过程,借鉴了操作条件作用、广义身份匹配和功能等价等关系认知的基础。在本研究中,我们假设系统使用不同的传感器与环境交互。一个将在整篇文章中使用的关键传感器是位置传感器的假设。视觉系统感知到的物体使用此模型都将被分配一个位置。标签如sample、left、right等是完全任意的。它们由设计者选择,仅是用于指示不同物体在不同位置被感知的标签。
我们还可以想象系统配备了颜色传感器,并正在与一个样本匹配程序(Matching-to-sample procedure)交互。例如,如图1所示,红色的东西在样本位置,绿色的在左边,蓝色的在右边。这可以描述为系统唯一的“眼睛”是位置和颜色,意味着其他物体属性如形状和大小不能被该系统感知。
我们在本文中表示这种与世界交互的方式如下:
<(sample ? red) --> (loc ? color)>. :|:
<(left ? green) --> (loc ? color)>. :|:
<(right ? blue) --> (loc ? color)>. :|:
场景由两个时间语句描述(由 :|: 指示)。在左边感知到一个绿色物体可以描述为感知左边和感知绿色之间的交互。因此,语句 <(left ? green) --> (loc ? color)> 可以被视为
<(sample ? A1) --> (loc ? ocr)>. :|:
<(left ? B1) --> (loc ? ocr)>. :|:
<(right ? B2) --> (loc ? ocr)>. :|:
机器心理学的基础建立在操作条件作用上,这是自适应行为的基本证明。在我们的研究中,NARS暴露于操作性应急情况,其中行为基于时间和程序推理被强化。这使得NARS能够通过与环境的交互来学习,根据反馈调整行动,类似于生物体如何响应后果而学习。结果表明,NARS可以通过强化获得和改进行为,为更高级的关系学习提供了必要基础。
在操作条件作用的基础上,我们的研究扩展到广义身份匹配,这涉及识别和响应不同刺激间的身份关系。这要求NARS利用复杂的学习机制,包括抽象和关系泛化。通过向NARS引入抽象机制,我们使其能够推导出超出明确训练示例的身份关系,反映了人类在符号匹配任务中的认知能力。结果表明,NARS可以将身份关系泛化到新刺激,展示了一种涌现的关系推理形式。
进一步推进机器心理学,我们探索了功能等价,这是一个过程,其中刺激由于共享的功能属性在指导行为中变得可互换。这项研究向NARS引入了额外的推理机制,使其能够基于蕴含和获得的等价性推导新关系。功能等价对于理解抽象类别如何形成和用于问题解决至关重要。我们的发现表明,NARS可以建立和应用功能等价关系,有效地在 distinct but related 刺激之间转移学习到的功能。
这些研究共同说明了从简单操作条件作用到复杂关系认知的进展,强化了机器心理学作为推进人工通用智能(AGI)的可行框架。
为了在OpenNARS for Applications (ONA)中实现任意适用关系反应(AARR)的建模,我们引入了一种称为获得性关系(acquired relations)的新机制。目前,ONA的推理主要基于感觉运动应急;然而,根据NARS理论(NAL定义8.1),关系词项(乘积)可以等价地表示为继承语句的复合词项。这一理论概念尚未在ONA中实现,其引入将允许系统直接从学习到的感觉运动应急中推导关系语句。
在NARS理论中,一个学习到的应急例如:
<(( p1> &/ q1>) &/ ^left) =/> G>.
可以产生一个获得性关系,正式表示为:
<(A1 ? B1) --> (p1 ? q1)>.
在本文采用的符号中,学习到的感觉运动应急通常采取形式:
<(sample ? red) --> (loc ? color)> &/
<(left ? blue) --> (loc ? color)> &/
<({SELF} ? (sample ? left)) --> ^match> =/> G>.
根据我们的方法,这产生两个不同的关系词项——一个描述刺激属性(颜色)之间的关系,另一个描述刺激位置的关系结构。
<(red ? blue) --> (color ? color)> &&
<(sample ? left) --> (loc ? loc)>
为了避免组合爆炸(即派生词项和推理的指数级增长),获得性关系的引入受到仔细限制。具体来说,仅当应急中的程序操作被系统主动执行时,才会生成新关系。这种有针对性的触发确保了计算效率,同时保持了功能通用性。
获得性关系可以与蕴含(implications)结合,这是NARS理论中的另一个核心元素(参见语句级推理),允许进行泛化的、上下文敏感的推理。例如,从先前显示的获得性关系,可以推导出以下蕴含:
<(red ? blue) --> (color ? color)> &&
<(sample ? left) --> (loc ? loc)> ==>
<(sample ? red) --> (loc ? color)> &/
<(left ? blue) --> (loc ? color)> &/
<({SELF} ? (sample ? left)) --> ^match> =/> G>.
更一般地,用变量抽象的蕴含采取这种形式:
<(1?2) --> (color ? color)> &&
<(3?4) --> (loc ? loc)> ==>
<(3?1) --> (loc ? color)> &/
<(4?2) --> (loc ? color)> &/
<({SELF} ? (3?4)) --> ^match> =/> G>.
这个框架可以理解为一个 grounding 机制,其中抽象关系(例如颜色-颜色)变得锚定在具体的感觉运动经验中。这使得NARS能够动态地从基本的、动物般的应急学习过渡到符号化的、人类般的推理能力。
当多个抽象关系模板或规则在推理过程中可能适用时,NARS通过优先选择具有最高真值期望(truth expectation)的规则来在这些模板中进行选择。NARS中的真值期望计算为与先前推导的关系蕴含相关的频率和置信度的函数:
exp(f, c) = c × (f - 1/2) + 1/2
其中频率 (f) 表示正面证据相对于总证据的比例,置信度 (c) 反映基于证据总量的支持程度。因此,推理使用具有最强组合证据支持的关系规则进行,反映了系统积累的关系学习经验。
相反,符号级关系语句也可以指导感觉运动行为。如果一个关系如 (blue → yellow) 被符号化地推导出来,它然后可以通过上述蕴含在 novel 情境中通知决策,前提是相关的位置关系(例如 (sample → right))通过与环境的直接交互建立。
获得性关系的概念是通用的,不限于样本匹配程序。例如,通过与不同程序交互获得的功能等价也会导致关系推导。
这种灵活性与当代学习心理学的观点密切一致,该观点认为任何规律性——例如刺激配对或在应急中的共同角色——都可以作为关系反应的上下文线索。
以下部分呈现概念性场景,说明逻辑推导而非实证实验。这些演示作为理论的概念验证,旨在说明所提出的NARS扩展如何能够实现任意适用关系反应(AARR)。在此纯粹理论背景下,定量性能指标(例如准确性、F1分数)不适用,但仍然是未来实证评估的重要目标。
关键的是,在此报告的所有理论测试阶段,我们仅呈现目标事件(G! :|:)以触发系统选择。我们在这些测试期间从未提供反馈或强化(G. :|:)。因此,我们的测试阶段严格遵循人类关系研究中使用的标准样本匹配(MTS)程序,确保在缺乏反馈的情况下进行真正的泛化测试。
与我们所复现的人类研究中使用的标准样本匹配程序一致,比较刺激的空间位置(左/右)在每个训练和测试块中的试验间被系统变化和平衡。这个程序在我们之前基于NARS系统的实验研究中也一直使用,确保关系反应不能依赖于位置线索。
在训练阶段,我们建议以正强化(G. :|:)形式提供正确反应的反馈,以负反馈(G. :|: {0.0 0.9})形式提供错误反应的反馈。在这个概念框架中,负反馈会降低相应蕴含的真值期望,理论上减少NARS重复错误行为的概率。这种方法允许NARS在理论层面上根据经验调整关系知识。然而,这个机制的实证测试仍然是未来研究的重要方向。
我们改编了来自关系框架理论(RFT)文献的两个范式:刺激等价和功能转移任务(任务1;图2)以及对立和功能转化任务(任务2;图3)。这些任务被修改以在概念上适应NARS的能力。重要的是,这些设置在OpenNARS for Applications (ONA)中并未实证实现;相反,它们在这里作为符号分析呈现,旨在说明NARS在理论扩展后如何能够解释这些形式的关系推理。
任务1的设计灵感来自Hayes等人(1987)引入的方法论。在他们最初的人类研究中,参与者经历了四个阶段:(1)训练条件性辨别,(2)测试派生的等价类,(3)在选定的类成员上训练辨别刺激功能,以及(4)测试辨别功能是否转移到同一等价类的其他成员。重要的是,原始研究没有考虑参与者先前的关
生物通微信公众号
知名企业招聘