运动校正眼动追踪技术提升视觉fMRI实验中注视定位精度

《Nature Communications》:Motion-corrected eye tracking improves gaze accuracy during visual fMRI experiments

【字体: 时间:2025年12月20日 来源:Nature Communications 15.7

编辑推荐:

  在视觉fMRI研究中,头部运动导致的眼动追踪漂移严重制约了自然视觉行为研究的精度。Park等人开发了基于fMRI头动参数的运动校正眼动追踪方法(MoCET),通过线性回归整合6自由度头动参数与多项式回归项,显著提升了自由观看任务中的注视定位精度。该方法无需额外硬件,可回溯应用于现有数据集,在行为预测和视网膜拓扑映射方面均优于传统去漂移方法,为自然情境下认知过程的神经机制研究提供了可靠工具。

  
当科学家试图通过功能磁共振成像(fMRI)研究人类在自然情境下的视觉认知过程时,一个看似微小却至关重要的问题始终困扰着他们:头部难以避免的移动会导致眼动追踪数据出现显著漂移,使得记录的注视点位置与真实视线产生偏差。在磁共振扫描仪这个特殊环境中,传统行为实验常用的下巴托或咬杆等头部固定装置无法使用,而安装额外运动传感器又面临技术限制。这种误差使得研究者难以精确关联视觉刺激、眼球运动与大脑神经活动,尤其在自由观看电影或互动任务等生态效度更高的实验范式中,该问题尤为突出。
为解决这一技术瓶颈,来自基础科学研究院成像研究中心的Jiwoong Park及其合作团队在《Nature Communications》发表了创新性研究方法。他们开发了一种名为运动校正眼动追踪(MoCET)的技术,巧妙利用fMRI数据预处理中常规获取的头部运动参数来校正眼动追踪误差。这种方法不仅无需增加任何硬件设备,还能回溯应用于已有数据集,为视觉神经科学研究提供了重要工具支撑。
研究团队首先通过几何眼球模型仿真验证了头部运动确实会引起眼动数据系统性漂移。模型模拟显示,即使在没有真实眼球运动的情况下,头部平移和旋转(包括俯仰、偏航等6个自由度运动)也会导致瞳孔坐标发生显著变化。特别值得注意的是,垂直方向的头部运动(如点头状俯仰)与垂直瞳孔坐标变化呈现高度相关性(相似性指数r=0.793)。通过相位随机化生成零分布进行统计检验,证实头部运动是造成眼动数据误差的主要因素(p<0.001)。
基于仿真结果,研究人员开发了MoCET校正算法。该方法将6自由度头动参数与三次多项式回归项结合,通过线性回归从原始瞳孔坐标中剔除头动引起的误差成分。多项式项的设计旨在捕捉MRI环境中仪器振动等非头动因素引起的低频漂移,而头动参数则负责校正与头部移动直接相关的高频变化。为验证线性假设的合理性,研究比较了人类数据与仿真数据的回归权重模式,发现水平头动(如左右平移和滚动旋转)主要影响瞳孔水平坐标,而垂直头动(如上下平移和俯仰旋转)则主导垂直坐标变化,两者趋势高度一致。
在方法验证环节,研究采用多维度评估指标。在标准验证任务中(参与者需注视屏幕上特定点),MoCET将眼动误差从校正前的显著水平降低至与实验室行为眼动追踪无统计学差异的程度(t(20)=1.34, p=0.195),显著优于传统线性去趋势和多项式去趋势方法。更具说服力的是,在自由观看的Minecraft视频游戏任务中,MoCET校正后的眼动数据能有效预测参与者未来行为:在建造或拆除方块前10秒内,参与者注视下一个目标位置的命中率显著高于随机水平,且与实验室行为数据无差异(t(20)=1.40, p=0.175),而传统方法表现接近随机水平。
研究还通过视网膜拓扑映射这一严格指标验证MoCET的精度。视网膜拓扑映射要求精确的注视点定位,因为视觉皮层的神经表征是相对于注视点组织的。使用MoCET校正的自由观看刺激生成的视网膜拓扑图(特别是极角图)质量显著优于其他方法,虽然在中央凹区域映射受限,但在外周视野表现出优势,这得益于自由观看任务自然涵盖更广的视觉范围。
针对实际实验中常见的跨扫描轮次(run)头动问题,研究提出跨run校正方案。通过将不同run的头动参数对齐至校准run的首个体素,MoCET仅需单个校准即可实现跨run校正,性能虽略低于run内校正,但显著优于简单的重定心和多项式去趋势方法。值得注意的是,即使在标定为“不可用”的数据中,跨run MoCET仍保持稳健性能,极大提升了方法实用性。
研究还对比了相机眼动追踪与新兴的磁共振眼动追踪(如DeepMReye)的性能。结果显示,基于深度学习的MR方法能捕捉大致注视方向(水平方向相关性最高r=0.574),但空间精度有限(欧几里得误差约5.5度),且预测点倾向于屏幕中心。而MoCET增强的相机追踪在空间精度和时序分辨率上均占优,更适合需要精确注视定位的研究。
关键技术方法方面,研究整合了多模态数据采集与计算建模。通过7T fMRI采集血氧水平依赖(BOLD)信号,同步记录60Hz眼动视频;采用PuReST算法进行瞳孔检测与追踪;基于径向基函数插值建立瞳孔-屏幕坐标映射模型;利用fMRIprep预处理获取6自由度头动参数;开发线性回归框架结合头动参数与多项式项进行漂移校正;通过几何眼球模型仿真验证头动影响;采用群体感受野(pRF)建模评估视网膜拓扑映射精度;使用DeepMReye进行MR眼动追踪对比分析。研究纳入18名参与者,包含Minecraft游戏任务、自然电影观看和标准pRF实验等多范式验证。
头部运动对眼动追踪的影响机制通过计算仿真得到验证。几何眼球模型模拟显示,即使模型执行中央注视任务,其全局眼动趋势与人类数据高度相似,特别是垂直瞳孔坐标与头部俯仰运动密切相关。头动引起的平面内偏移与人类数据呈现强线性关系(r=0.917),仿真相较于相位随机化头动数据显著更接近真实情况(p<0.001),证实头动是眼动误差的主要来源。
MoCET校正效能在多个维度超越传统方法。在验证阶段,MoCET将注视误差降至与行为实验相当水平,显著优于高阶多项式去趋势(12阶)。在行为预测方面,MoCET校正数据能准确捕捉任务相关注视模式,而传统方法表现接近随机。视网膜拓扑映射结果显示,MoCET在自由观看条件下恢复的极角图精度最高,尤其在外周视野优于传统pRF映射。
跨run校正拓展了方法适用场景。通过单次校准迁移至后续run,MoCET有效校正run间头动引起的系统误差,即使在校准质量差的run中仍保持稳定性能。这种跨run泛化能力减少了实验中对重复校准的依赖,提升了数据利用效率。
与MR眼动追踪的对比突显相机追踪优势。DeepMReye模型虽能捕捉注视方向趋势,但空间精度有限(误差>5度)且存在中心偏差。而MoCET增强的相机追踪在空间和时间精度上均更优,适合需要精细注视分析的研究。
研究结论强调,头部运动是fMRI眼动追踪误差的主要来源,而MoCET通过整合fMRI头动参数提供了一种有效校正方案。该方法在自由观看实验中实现了高精度眼动追踪,使注视数据能可靠预测行为并支持精确视网膜拓扑映射。跨run校正能力进一步扩展了方法实用性,而与传统MR眼动追踪的对比明确了各自适用场景。研究发布的高质量眼动数据集和开源Python工具包将促进该领域方法学发展。
讨论部分指出,MoCET的线性假设在典型fMRI头动范围内有效,非线性扩展仅在极端运动下有微弱优势。虽然实时应用受fMRI时间分辨率限制,但仿真显示即使1Hz采样下MoCET仍优于传统方法。未来工作可探索实时集成方案,拓展其在神经反馈等闭环范式中的应用。该研究通过创新性运动校正方法,为自然视觉认知的神经机制研究提供了可靠技术支撑。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号