《Scientific Reports》:Contours drive distinct orientation selectivity in the human visual system
编辑推荐:
本研究针对自然场景中方位信息处理的本质问题,通过行为实验和功能磁共振成像(fMRI)技术,系统比较了基于轮廓和基于滤波的方位计算模型。结果发现,人类视觉系统在处理真实场景时更依赖于轮廓定义的物体边界信息,而非传统滤波方法提取的方位能量。该研究为理解高级视觉处理机制提供了新视角,对视觉神经科学和计算机视觉领域具有重要意义。
当我们观察周围世界时,大脑如何快速理解场景中各种元素的朝向?自Hubel和Wiesel发现初级视觉皮层(V1)中存在方位选择性神经元以来,这一直是视觉科学的核心问题。传统模型认为,视觉系统通过类似Gabor滤波器的机制处理方位信息,这些滤波器能够模拟V1神经元的感受野特性,同时分析多种空间频率下的方位能量。
然而,这种基于滤波的方法存在一个重要局限:它将场景中的各种方位信息——包括锐利边缘、渐变的亮度过渡以及细微的表面纹理——不加区分地整合在一起。与此相反,轮廓信息专门捕捉定义物体形状的边界结构,这对物体和场景的识别分类至关重要。在真实场景中,这两种方位信息常常交织在一起,但视觉系统是否对它们同等重视,还是优先处理某一种信息,至今仍不明确。
为了解答这一问题,多伦多大学的Seohee Han和Dirk B. Walther在《Scientific Reports》上发表了他们的最新研究。他们通过两个互补的研究,探索了人类视觉系统在处理自然场景方位信息时的偏好。
在研究1中,研究人员设计了精巧的行为实验。他们从自然场景数据集(NSD)中选取图像块,这些图像块经过特殊筛选,使得基于轮廓和基于滤波的方法计算出的平均方位差异最大化或最小化。参与者被要求判断这些图像块的平均方位,结果发现他们的判断更接近轮廓模型预测的方向,尤其是在两种方法计算结果差异较大的情况下。这一现象不受反应方式(使用条形或光栅探针)的影响,表明人类视觉系统在处理复杂场景时确实优先考虑轮廓定义的边界信息。
研究2进一步探讨了这种知觉偏好是否反映在神经表征上。研究人员利用NSD的高分辨率7T fMRI数据,比较了三种图像可计算模型对视觉皮层神经活动的解释能力:照片-可操纵金字塔模型、线描图-可操纵金字塔模型和轮廓模型。结果显示,两个基于线描图的模型(特别是线描图-可操纵金字塔模型)比传统的照片-可操纵金字塔模型更能解释V1-hV4区域的神经反应方差。
更重要的是,不同模型生成的方位选择性图谱存在显著差异。传统的照片-可操纵金字塔模型再现了先前研究中观察到的径向偏差(radial bias),即V1神经元偏好与视野中心径向对齐的方位。而两个基于轮廓的模型则显示出更强的垂直方位偏好,特别是在低离心率区域。这一发现通过巧妙的残差分析得到进一步验证:当从fMRI信号中剔除轮廓信息后,剩余的神经活动仍显示径向偏差,表明这种偏差主要来源于非轮廓信息(如渐变亮度梯度和表面纹理)。
关键技术方法包括:1)使用可操纵金字塔滤波器(Steerable Pyramid)进行多尺度方位能量分析;2)基于中级视觉工具箱(Mid-Level Vision Toolbox)提取轮廓信息;3)利用自然场景数据集(NSD)的7T高分辨率fMRI数据;4)群体感受野(pRF)映射技术;5)交叉验证的多元回归分析。
研究结果部分显示:
人类方位判断的行为实验
通过比较参与者的方位判断误差与两种模型预测值,发现无论使用条形还是光栅作为反应探针,参与者的判断都更接近轮廓模型的预测。在两种方法差异最大的条件下,这种偏好尤为明显,误差显著小于与滤波模型的比较。
神经表征的模型比较
线描图-可操纵金字塔模型的交叉验证R2值最高(0.0335),其次是轮廓模型(0.0306),传统照片-可操纵金字塔模型表现最差(0.0144)。模型优势在不同视觉区和不同离心率位置都一致存在。
方位选择性图谱的差异
虽然所有模型都显示出粗尺度的方位选择性图谱,但基于轮廓的模型显示出更强的垂直方位偏好,而传统滤波模型主要显示径向偏差。这种差异不能简单地归因于图像中方位分布的差异,因为尽管照片和线描图-可操纵金字塔模型的输入图像方位分布相似,但它们产生的选择性图谱却截然不同。
研究的结论部分强调,人类视觉系统在处理自然场景时优先提取轮廓信息而非均等整合所有方位信号。这一发现对视觉神经科学领域具有重要意义:首先,它挑战了基于滤波的传统模型对视觉处理的简化假设;其次,它揭示了轮廓信息在视觉处理中的核心地位;最后,它为理解真实场景下的视觉处理提供了新视角。
这项研究不仅深化了我们对视觉系统工作机制的理解,也为计算机视觉领域提供了重要启示:融入轮廓优先策略的算法可能更接近人类视觉处理机制,从而开发出更鲁棒和人性化的视觉处理系统。未来研究可探索轮廓优先原则是否适用于深度和运动感知等其他视觉领域,进一步揭示视觉系统处理复杂环境信息的高级机制。