编辑推荐:
为解决早期奖励系统研究不足及相关精神疾病干预难题,肯尼迪克里格研究所等机构的研究人员开展了婴儿和儿童奖励处理研究。结果发现早期奖励机制与成人不同。该研究为理解大脑发育和疾病病理提供依据,值得科研人员一读。
理解功能性大脑回路的发展:以奖励处理为例
梅娅?奥彭达克(Maya Opendak),海蒂?迈耶(Heidi Meyer),布里奇特?L?卡拉汉(Bridget L. Callaghan),利奥尔?阿布拉姆森(Lior Abramson),沙纳?瑞秋?约翰(Shanah Rachel John),凯文?巴斯(Kevin Bath),弗朗西斯?李(Francis Lee),尼姆?托特纳姆(Nim Tottenham),雷吉娜?沙利文(Regina Sullivan)
摘要:异常的奖励处理在发育过程中开始的精神疾病中很常见。然而,由于很少有研究评估不同发育阶段的奖励参与情况,人们对早期奖励系统的理解有限。此外,对这些研究结果的解释主要基于对成体奖励系统的理解。在此,肯尼迪克里格研究所(Kennedy Krieger Institute)等机构的研究人员认为,必须在发育转变的背景下重新构建早期奖励处理的研究方法。这种不同的视角考虑到了独特的、特定年龄的大脑网络功能,这些功能随着环境需求从婴儿期到儿童期的变化,促进适应性行为。研究人员调查了关于发育中奖励系统的文献,并提出以下关键问题:(1)如何为婴儿和儿童定义奖励性刺激?(2)成体定义的神经奖励回路是否也支持早期奖励行为?(3)早期回路扰动如何影响婴儿和成年后的回路功能?总之,研究人员认为,这种以发育生态位为中心的框架对于从概念和理论上探讨发育研究问题是必要的,包括但不限于奖励研究范畴。最后,这个框架有助于理解发育过程中的干扰最终如何表现为病理状态。
引言
准确评估奖励对个体一生中的适应性行为至关重要,并且在许多精神疾病中,奖励评估会发生改变,这些疾病包括物质使用障碍、抑郁症和精神分裂症等。其中许多疾病起源于生命早期,此时大脑具有高度的可塑性,且易受环境因素影响。为了针对生命早期受到不良影响而引发的疾病开发有效的、适合特定年龄段的干预措施和疗法,研究人员首先需要了解未成熟的大脑如何处理环境信号以指导行为。然后,研究人员必须了解这些神经回路如何变化,以适应不断成熟的感觉信号、机体的新需求,以及与环境更丰富的互动,从而支持更复杂的行为模式。基于此,研究人员可以开始理解发育过程中的干扰最终如何表现为病理状态。
目前关于奖励处理的大部分知识,来自对完整的成年人类和非人动物的解剖学、生理学和行为学研究。在发育研究中,行为反应和区域激活测量结果通常在成体神经回路的框架内进行解释。然而,感觉运动整合、被确定为对成体奖励处理至关重要的关键节点之间的区域连接,以及这些脑区的细胞组成仍在发育过程中。在此,研究人员提倡一种受发育限制的研究方法,重点关注跨物种研究,以更好地定义发育过程中不断演变的行为模式与支持这些行为的神经生物学结构之间的关系。研究主要集中在啮齿动物研究上,因为这方面的文献对神经回路发育进行了更细致的描述。同时,研究人员也参考人类发育文献,以建立转化联系。
研究人员认为,在非线性回路发育及其转变的背景下重新构建对早期奖励的研究,有助于确定(1)病理根源和(2)治疗和干预的新靶点。更具体地说,这种方法考虑到了独特的、特定年龄的大脑网络功能,随着环境需求从婴儿期到儿童期的变化,这些功能会促进适应性或适应不良的行为。这种考虑对于定义、测量和解释早期奖励功能至关重要。研究人员调查了现有文献,并提出疑问:如何通过实验为婴儿和儿童定义奖励性刺激?如何为他们调整奖励任务?成体定义的神经奖励回路是否也支持早期奖励行为?最后,早期回路扰动如何影响婴儿和成年后的回路功能?
文献表明,尽管一些奖励行为在婴儿期就表现得较为成熟,但婴儿和成人用于支持这些行为的脑区可能不同。此外,对婴儿有奖励作用的事物,对年龄较大的个体不一定有奖励作用,反之亦然。研究人员使用 “发育转变” 这一术语,主要指环境需求的变化,这种变化伴随着行为和神经生物学的改变,例如从以照顾者为导向的行为转变为以同伴为导向的行为。通过在奖励的神经行为评估中重新考虑发育转变,研究人员提出,这种发育生态位对于定义奖励概念和剖析其神经基础至关重要。这样做的目的是挑战那些阻碍人们理解发育中大脑的普遍假设。
尽管研究人员目前主要关注奖励处理,但这些问题也适用于任何发育功能的研究。因此,研究人员希望他们的方法不仅能为设计适合特定年龄段的奖励任务提供具体的思考方向,还能为研究生命早期的大脑功能提供一个通用的概念框架,并提醒人们避免用成人大脑回路来解释生命早期的行为。
将成体定义的奖励回路映射到婴儿和儿童身上所面临的挑战
在成年人中,奖励性刺激的标准定义包含三个组成部分:渴望(激励显著性,即激发趋近行为)、喜爱(引发愉悦或享乐感觉)和驱动联想学习(经典条件反射和操作性条件反射)。大量文献表明,在成年人和青少年中,多巴胺在奖励处理中起着核心作用,尤其是通过中脑边缘多巴胺系统,该系统包括腹侧被盖区(VTA)、腹侧纹状体(主要是伏隔核,NAc)、内侧前额叶皮层(mPFC)和杏仁核。除了这条神经回路,梨状皮层、内嗅皮层、脑岛、眶额皮层和背侧纹状体等结构,都参与了成年人奖励学习的学习和表达过程。虽然奖励学习可以在没有多巴胺(DA)的情况下发生,并且血清素(5 - HT)在某些形式的成人奖励学习中也发挥作用,但鉴于现有关于奖励神经生物学这一特定底物的发育证据,研究人员在此重点关注婴儿和成人在多巴胺参与方面的差异。
基于多种证据,这些脑区被纳入奖励神经通路。在非人动物研究中,实验操作表明,这些区域对于在青少年和成年人中产生渴望、喜爱或联想学习,是必要的、充分的,或两者兼具(见上述综述)。在人类神经成像数据中,这些区域在奖励任务中也有出现(例如)。然而,大多数神经科学家认为,仅靠神经激活来衡量大脑功能是有限的。婴儿大脑也表现出对奖励敏感的激活,但在解释这些模式时必须谨慎。在发育过程中,这种谨慎尤为重要,因为内部和外部输入的波动很常见,这些波动为新兴的神经系统提供支持、编程和组织,但这种活动并不意味着其在成人意义上具有充分或必要的功能。
尽管细胞增殖并分化成符合成人大脑可识别区域特征的模式,是大脑成熟的关键一步,但结构的存在并不一定意味着功能有效。实际上,在功能成熟和产生行为输出之前,结构成熟使脑区能够产生内在信号并对环境做出反应。这一点可以用视觉系统清楚地说明:在视觉功能出现之前,甚至在眼睛睁开之前,视网膜中就存在内在活动波,这些波引导大脑发育。这些波先于刺激诱发的活动(视觉)出现,而视觉在网络功能成熟后最终指导行为(注视)。换句话说,这些产生神经信号的内在波,不能通过成熟的成人神经成像视角来解释,也不能直接用于解释围产期大脑。相反,神经信号可能反映了大脑在神经活动无法对行为产生贡献时的编程过程。就奖励回路而言,在失明失聪的幼年大鼠中,可能会在后来被确定为伏隔核的区域观察到内在活动波(波 1)。在接近照顾者后,同一群细胞可能会表达即早基因(波 2)。然而,损伤这个区域不会影响接近行为,这表明它既不是支持行为所必需的,也不是充分的,不符合波 3 的要求。
因此,在没有进行功能获得和功能缺失研究以评估必要性和充分性的情况下,仅靠发育中大脑的活动标记物水平,如即早基因表达或血氧水平依赖(BOLD)反应,是一种有限的检测方法。这凸显了跨物种研究的重要性,通过跨物种研究来检验假设,以便更好地理解人类发育中大脑神经发育的一般原则。
在定义了成人的奖励处理和神经生物学之后,研究人员可能会简单地问,相同的系统是否在生命早期支持奖励功能。然而,在发育的背景下,必须首先考虑几个关键问题。第一,如何在生命早期评估奖励?贝里奇提出的三个组成部分(渴望、喜爱、驱动联想学习)在婴儿期和儿童期通常不被用作先决条件,这表明可能需要一组不同的条件来定义奖励。第二,行为相似性是否意味着整个发育过程中神经回路的连续性?奖励功能的行为表现,包括对蔗糖的反应以及与经典和操作性条件反射相关的复杂奖励处理,在非常年幼的时候(人类新生儿和幼年啮齿动物)就可以观察到,通常与成人的表现相似。然而,在试图解释不同发育阶段的行为发现时,假设在成人中确定的大脑回路在婴儿大脑中也起作用,还为时过早,并且可能会产生误导。
考虑到这些因素,研究人员主张重新构建在定义发育中奖励回路时所提出的问题和接受的答案。下面,研究人员回顾了关于婴儿和儿童如何处理和学习奖励线索的神经解剖学证据,重点关注社会刺激。研究人员主要关注啮齿动物的研究结果,因为这方面的文献对婴儿奖励系统的神经回路和发育时间进程提供了更详细、更精细的理解。在有人类研究结果的情况下,研究人员也会进行回顾,以指出可能促进跨物种研究的相似点和差异点。
对婴儿有奖励作用的是什么?
社会线索,特别是与母亲相关的线索,在生命早期是引发接近和学习行为的强大因素。晚成性婴儿的生态环境将照顾者(生存的来源)提升为最有力的激励刺激。根据上述奖励的定义,确实是照顾者以及与照顾者相关的线索,产生了联想学习,引发了预期的趋近行为(渴望 / 激励显著性),和 / 或产生了享乐反应(通过消耗反应的强度来衡量)。因此,许多剖析奖励潜在神经回路的研究,都将照顾者作为刺激物。然而,仅仅将父母这个复杂的个体视为一种社会奖励,无法解释父母发出并被婴儿接收的特定感觉线索和行为,所有这些都由与成人不同的独特回路支持。在本节中,研究人员回顾了关于婴儿奖励功能的行为和神经解剖学证据,重点区分作为复杂照顾者刺激组成部分的学习线索(母乳、气味、触觉刺激),和表面上与照顾者无关的线索(药物、食物颗粒)。
人类和啮齿动物对与照顾者相关线索的趋近性条件反射
在人类和大鼠的新生儿中,母亲的气味都会引发接近行为。新的母亲气味也可以通过经典条件反射在人类和啮齿动物中被学习。在新生儿中,哺乳期母亲使用的香水很快就会被识别并受到偏好,出生后立即与母亲进行皮肤接触,已被证明会在四天后增加对母亲乳汁气味的接近行为(即吸吮动作)。在出生后前 4 天母乳喂养期间接触过洋甘菊香味香膏的新生儿,即使在 1.5 年后,对这种香味仍表现出更多的渴望和喜爱行为(即更少的负面面部表情,更多的探索、吸吮动作,以及对该气味的优先选择)(然而,较少的负面面部表情也可能反映出习惯化)。这个过程可以在新生儿中通过经典条件反射模拟:将一种新气味与触觉刺激(模拟按摩)配对几次后,会导致随后对该气味的偏好(转头、吸吮动作),而未配对呈现则不会诱导这种偏好。
利用啮齿动物,人们揭示了学习新母亲气味的因果机制:将一种中性气味与引发母亲照顾特定方面的刺激(例如牛奶、用画笔抚摸模拟梳理毛发)在巢穴外配对,会使幼崽接近该气味,而且这种气味还可以替代天然的母亲气味,支持依赖母亲气味的乳头附着行为。一个意外的发现是,有大量的刺激可以作为奖励,支持经典条件反射的气味偏好学习,包括被认为是奖励性的刺激,如牛奶和温暖,也包括通常会引发厌恶的刺激,如对尾巴或脚施加 0.5 毫安的电击或捏尾巴,这可能会带来疼痛。这些刺激似乎与母亲和母亲的行为有关,疼痛可能与母亲粗暴的照顾行为有关,比如踩到幼崽。这种情况在成年后不会发生,在出生后第 15 天就会结束。如下文将讨论的,婴儿期这种多样的奖励分类,在婴儿气味偏好学习的神经基础中趋于一致。
促进学习与照顾者相关线索的神经回路避开多巴胺能系统
来自啮齿动物的证据
虽然在啮齿动物和人类中,对与照顾者相关线索的趋近性学习都说明了奖励处理过程,但支持这个系统的神经回路,似乎与成年后定义的奖励回路不同。婴儿的这种奖励学习是一个高度稳健的系统,至少根据啮齿动物的数据,它涉及一个独特的神经回路,包括蓝斑、前梨状皮层和嗅球。值得注意的是,腹侧被盖区、伏隔核和其他对成人奖励功能至关重要的区域,并不参与这个基本的学习过程。
在出生后的前 9 天,大鼠幼崽通过一种简单的机制学习新的母亲气味(这种刺激会引发接近行为和依赖母亲气味的乳头附着行为):当气味与模拟母亲照顾的线索(如牛奶、温暖、抚摸,但也包括电击)配对时,蓝斑会释放大量去甲肾上腺素(NE)涌入嗅球。嗅球僧帽细胞的轴突直接投射到梨状皮层,梨状皮层在以区域特异性的方式为学习到的气味赋予享乐价值方面起着重要作用。特别是,前梨状皮层在这个敏感期内对学习到的气味有反应,而后梨状皮层在出生 10 天后的幼崽和成年个体中,对更复杂的学习到的气味厌恶有反应。当幼崽大约 10 天大时,这个敏感期结束,因为蓝斑对重复的刺激呈现表现出自我抑制和习惯化,去甲肾上腺素的释放变得更像成年大鼠。出生 10 天后,蓝斑释放的去甲肾上腺素在气味学习中起到调节作用,类似于在成年大鼠中所描述的情况。
除了去甲肾上腺素,嗅球还接收额外的外在单胺能输入,这些输入会改变兴奋 / 抑制平衡,影响嗅觉学习。在出生后的第一周,从缝核发出的密集的血清素(5 - HT)输入可以在大鼠嗅球的所有层中检测到。在嗅球中耗尽血清素会损害新生大鼠的趋近性嗅觉学习,这表明嗅球中的血清素参与了正常的嗅觉学习。此外,5 - HT?受体亚型的存在也用于趋近性嗅觉学习的获得,但不参与学习的巩固或提取。然而,高水平的去甲肾上腺素输入可以在嗅球内血清素耗尽的新生大鼠中诱导气味学习,这表明去甲肾上腺素可以绕过血清素的功能。相反,注射 5 - HT?受体激动剂并不能诱导气味学习。此外,去甲肾上腺素 β - 肾上腺素能受体和 5 - HT?A 主要在嗅球僧帽细胞中共定位并相互作用。因此,有人认为血清素在处理非条件刺激信息的过程中,促进去甲肾上腺素对僧帽细胞的直接作用。
总之,这种独特的婴儿神经回路促进了对那些增强对照顾者的接近和寻求亲近行为的线索的消耗行为。重要的是,婴儿的奖励学习严重依赖去甲肾上腺素,而不是成人定义的典型 “奖励回路”,即从腹侧被盖区到伏隔核的多巴胺(DA)信号传导。实际上,虽然多巴胺能输入对成人的趋近性学习很重要,但这些投射在出生后第三周左右才表现出较晚的功能成熟,在围产期婴儿中可能没有功能,而此时经典条件反射已经得到了充分的证明。因此,多巴胺能输入不太可能在早期嗅觉学习中发挥作用。此外,这个学习系统以前并没有从支持 “奖励” 的角度进行研究,而是从利用巢穴外的经典条件反射来学习与母亲的 “依恋” 和乳头附着的角度进行研究。因此,在定义生命早期的奖励回路时,可能会因为语义问题而产生混淆,因为人们需要考虑与成熟和不断变化的生态环境相关的转变。然而,在整个发育过程中,确实存在程序上(经典条件反射)和行为输出(偏好、接近学习)的连续性,这为评估支持性神经回路的差异提供了一个框架。
对于幼年啮齿动物来说,可能是多巴胺能系统还不够成熟,无法处理奖励,这种处理是通过上述的去甲肾上腺素和血清素系统进行的。实际上,在大鼠的前额叶皮层和纹状体中,多巴胺的神经支配、受体密度和转运体密度在婴儿期和幼年发育阶段逐渐增加,在青春期达到峰值。如前所述,非多巴胺能系统也参与了成人的奖励学习。例如,桑德斯和罗宾逊的研究表明,通常被认为是由奖励驱动的目标追踪行为,可以在没有多巴胺的情况下发生。此外,温斯坦利等人证明,血清素在成人的决策和延迟奖励处理中有着显著影响。尽管如此,关于婴儿类似奖励行为(接近照顾者线索)的现有证据表明,关注多巴胺信号传导,凸显了在整个生命周期中服务于这种行为的独特神经生物学。
来自人类的证据
成人标准的多巴胺奖励系统和 / 或去甲肾上腺素是否参与人类婴儿的奖励处理和依恋学习,仍是一个悬而未决的问题。一项针对新生儿的研究发现,在闻到奖励性气味(配方奶)时,小脑的 BOLD 激活增加,大多数新生儿的梨状皮层、丘脑、眶额皮层和脑岛也有激活增加的现象。另一项使用功能近红外光谱(fNIRS)的研究发现,与配方奶气味相比,新生儿在闻到自己母亲的母乳气味时,眶额皮层的激活增加。其他研究发现,新生儿在听到令人愉悦或熟悉的音乐时,尾状核(背侧纹状体的一部分)与感觉区域之间的静息态功能连接增加,而音乐对人类来说是非常有奖励性的。
这些发现表明,与啮齿动物的研究结果存在一些相似之处(例如梨状皮层激活),并且涉及与记忆相关区域(