
-
生物通官微
陪你抓住生命科技
跳动的脉搏
多尺度脑仿真人工智能框架"Orangutan":动态环境下的类脑计算新范式
【字体: 大 中 小 】 时间:2025年05月22日 来源:Scientific Reports 3.8
编辑推荐:
为解决传统深度神经网络(DNN)在泛化性、数据依赖性和环境适应性等方面的局限,研究者提出多尺度脑仿真AI框架Orangutan。该框架通过模拟神经元多室结构、神经微环路和皮层柱等生物机制,构建了具备生物合理性的感知运动模型,在MNIST手写数字观察任务中验证了算法有效性,为通用人工智能(AGI)发展提供了新路径。
在人工智能领域,实现类人水平的通用智能(AGI)始终是终极目标。当前主流的深度神经网络(DNN)虽在特定任务表现出色,却面临泛化能力弱、数据依赖性强等瓶颈。这些局限源于DNN与生物神经系统的本质差异——后者通过多尺度协同的精细机制,展现出惊人的能效比和环境适应性。为此,来自阿里巴巴集团的研究团队在《Scientific Reports》发表创新成果,提出名为"Orangutan"的多尺度脑仿真人工智能框架,通过跨尺度模拟生物神经机制,为动态环境下的智能决策提供新范式。
研究团队采用Python构建的Orangutan框架包含三大核心技术:多室神经元模型模拟树突-胞体-轴突的兴奋传递过程;基于连接特异性规则的神经微环路系统实现WTA竞争等核心算法;分层感知运动网络模拟人类视觉的腹侧/背侧通路。研究使用MNIST手写数字数据集,构建包含13个脑区、370万神经元的动态模型验证算法效能。
在微观尺度建模中,研究创新性地采用多室神经元替代传统"点"神经元,通过Eq.(1)-(2)模拟兴奋传递过程。每个神经室具有RP(静息电位)、Fa(易化作用)等18种电生理特性,支持MAX/MIN逻辑运算的树突结构显著提升计算复杂度。中观尺度上,框架精确模拟了6类突触连接模式(包括轴-树突触、自突触等),构建的侧抑制、递归抑制等微环路实现特征对比增强功能。宏观层面则通过皮层柱拓扑映射,在28×28网格上复现视觉系统的视网膜-外侧膝状体投射关系。
感知阶段模型成功提取边缘点、方位角、向量等视觉特征。通过Eq.(3)定义的中心-外周拮抗感受野,边缘点细胞CEdgo对特定朝向的亮度梯度产生响应。方位细胞COris,o,a采用Eq.(4)的最大值运算机制,展现类似复杂细胞的位置不变性。引人注目的是向量细胞CVecs,o,a通过Eq.(7)的末端抑制机制,有效解决大尺度特征干扰问题,该设计灵感源自视觉皮层的end-inhibition现象。
运动控制方面,研究创新地整合网格细胞原理与WTA机制。当CAng或CArc特征细胞通过集中式竞争网络(图12)胜出时,将激活对应位置的网格细胞,驱动CCurX/Y坐标神经元更新。实验显示该模型能准确追踪数字"2"的弧线特征(图9f)和"7"的角点特征(图9e),模拟人类眼跳的序列注意转移。抽象表征层则通过CRelX/Y神经元建立特征间空间关系,为后续符号化认知奠定基础。
在56×28样本测试中,模型展现出类人的视觉搜索策略,但存在对小角度特征的过度响应(Eq.(8)中λ=0.08的增益设置所致)。研究者指出当前局限主要源于感受野尺度上限(21像素)和缺乏主动注意机制。未来将通过引入海马回放、树突棘资源竞争等生物机制增强学习能力。
这项研究的重要意义在于:首次在统一框架下整合从离子通道特性到脑区连接的多尺度生物机制,突破传统AI模型的尺度壁垒。虽然计算成本高于传统CNN(局部连接特性可部分缓解),但其采用的STP(短时程增强)、LTD(长时程抑制)等突触可塑性机制,为发展具备在线学习能力的AGI系统提供新思路。正如讨论部分强调,Orangutan的模块化设计使其能持续融入新发现的神经计算原理,这种"生物兼容性"正是其区别于HTM、Spaun等现有脑启发框架的核心优势。
生物通微信公众号
知名企业招聘