
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于流解析的并行源分离模型:实现快速自运动与物体运动同步估计的计算神经机制
【字体: 大 中 小 】 时间:2025年06月18日 来源:Communications Biology 5.2
编辑推荐:
本研究针对视觉导航中自运动(heading)与独立运动物体(IMO)信息同时提取的难题,提出FLOW PARSE计算模型。通过构建基于航向似然图(heading likelihood maps)的流解析(flow parsing)机制,首次实现从光流(optic flow)中并行解耦自运动与物体运动信息。模型成功复现人类行为特征:航向估计误差随物体速度呈非单调变化(峰值0.88-1.56 dva),物体检测率与流场偏差度正相关(方向偏差>27°或速度比>1.65时达75%),且物体轨迹估计符合场景相对运动(scene-relative motion)特征。该成果为理解大脑运动信息分离机制提供新计算框架,发表于《Communications Biology》。
在足球运动员接球、驾驶员避让行人等日常场景中,人类能神奇地从视网膜上混杂的光流(optic flow)中同时解出自运动(heading)和物体运动信息。这种被称为"流解析"(flow parsing)的能力长期困扰着神经科学家——当视网膜运动是自运动与物体运动的矢量叠加时,大脑如何实现信息的因果分离?传统理论认为需要先估计航向再推算物体运动,但近年研究发现两者可能并行处理,且人类对物体场景相对运动(scene-relative motion)的判断精度甚至高于航向感知。这一矛盾提示存在更高效的计算机制。
德国明斯特大学Malte Scherff和Markus Lappe团队在《Communications Biology》发表的研究,构建了名为FLOW PARSE(基于流的并行源分离)的计算模型。该模型创新性地通过分析残差表面(residual surfaces)的鞍点结构,实现自运动与物体运动信息的同步提取,无需迭代计算或反馈连接。研究开发了系统控制物体运动参数(水平速度0-1 m/s,深度运动分量λ∈[-1,1])的仿真范式,通过2760个视网膜位点的流场分析,首次在单一框架内复现了人类行为的多重特征。
关键技术包括:(1)基于子空间算法(subspace algorithm)构建航向似然图;(2)多尺度鞍点算子检测残差表面分布特征;(3)双阈值(τ1
=3, τ2
=4.5)控制的流解析路由机制;(4)视网膜坐标系下的物体运动矢量分解。使用包含50个点的运动物体(直径1-8 dva)嵌入随机点云环境(深度4-10 m),模拟不同空间布局下的147种运动场景。
【The FLOW PARSE模型结构】
模型采用四级前馈架构:第一层模拟MT脑区进行局部运动矢量平均;第二层通过子空间算法计算36个视网膜区域的残差表面;第三层通过交叉型感受野算子识别残差分布的鞍点特征,将信息分流至航向或物体估计通路;第四层分别生成航向图和物体参数。关键创新在于利用残差表面双峰结构直接指示物体位置(鞍点)和运动方向(峰轴取向),而非传统的光流矢量减法。
【流解析质量】
当物体运动使合成流速度比>1或方向偏差>10°时,残差表面正确分配率达83.8%。特别在"接近"条件(λ=-1)下,即使水平速度仅0.125 m/s,正确率仍达74.6%,验证了深度运动分量的关键作用。

【航向估计】
模型复现了人类典型错误模式:当物体以中等速度(0.25 m/s)后退(λ=1)时,航向误差达峰值1.56 dva,其中80%偏差沿物体运动方向。这与Dokka等人的人类数据一致,支持"因果推断"计算原理。

【物体估计】
检测性能呈现显著速度依赖:水平速度>0.625 m/s时定位误差<1 dva,方向估计呈现11.9°-34.6°的系统倾斜(向FOE方向),完美匹配Warren等人的人类行为模式。值得注意的是,在单侧流场实验中,即使背景流与物体异侧,仍保持8.6°的倾斜特征,证实处理机制的全局性。

研究结论指出,该模型通过四个重要突破推进了运动感知理论:(1)证明基于残差表面分布的流解析可实现因果源分离;(2)揭示航向误差峰值源于中等速度物体的因果模糊性;(3)首次用计算模型统一解释场景相对运动估计的倾斜现象;(4)阐明MSTd脑区可能通过类似鞍点检测的机制并行处理运动信息。在30%方向噪声下仍保持83%的物体检测率,展现强鲁棒性。
这项研究为自动驾驶、虚拟现实的运动感知算法提供新思路,其"前馈式并行处理"框架挑战了传统迭代模型的必要性。作者特别强调,模型预测当物体运动产生>85%速度变化或>46°方向偏差时,人类神经元应表现出类似鞍点检测器的响应特性,这为未来神经生理学研究提出可验证的假设。
生物通微信公众号
知名企业招聘