计算模型揭示直觉物理学是软物体视觉处理的基础机制

【字体: 时间:2025年07月10日 来源:Nature Communications 14.7

编辑推荐:

  本研究通过开发"Woven"计算模型,创新性地揭示了人类视觉系统处理软物体(如布料)时依赖直觉物理学的内在机制。研究人员针对传统视觉模型仅适用于刚性物体的局限,通过结合物理模拟与概率计算,首次构建了能够解释人类对布料刚度(stiffness)和质量(mass)感知的计算框架。该模型在跨场景匹配任务中不仅成功预测人类判断准确性(r=0.84),更独特地解释了人类在质量判断中的系统性错误模式,为理解复杂视觉推理提供了新范式。研究成果发表于《Nature Communications》,为发展类人机器视觉系统提供了关键理论支撑。

  

当我们看到随风飘动的窗帘或落在椅子上的衬衫时,大脑能瞬间判断布料的柔软程度,这种看似简单的日常能力实则隐藏着视觉科学的重大谜题。传统视觉研究主要关注形状恒定的刚性物体,但现实世界中充满像布料这样的软物体——它们形态多变、物理特性复杂,在运动中会产生高维动态形变。现有深度神经网络(DNN)模型虽能处理刚性物体,却难以解释人类对软物体物理属性(如刚度s、质量m)的精准感知,这暴露了当前视觉模型的本质局限。

耶鲁大学认知与神经计算实验室的研究团队在《Nature Communications》发表突破性研究,通过开发"Woven"计算模型,首次证明人类视觉系统处理软物体时依赖直觉物理学的内在模拟机制。该研究创造性地将物理引擎嵌入概率计算框架,实现了对布料动态的生成式建模,其性能远超传统DNN模型,不仅能匹配人类判断准确率,更能预测其错误模式。

研究采用四项关键技术:1) 基于FLeX引擎的布料物理模拟,构建四种自然场景(风力作用、斜坡碰撞等);2) 序列蒙特卡洛(SMC)算法实现概率推理;3) 设计跨场景心理物理实验,要求被试匹配布料刚度/质量;4) 开发深度神经网络基线模型进行对比验证。通过200名被试和4960次模拟实验的系统验证,研究取得以下重要发现:

Psychophysical matching of cloth dynamics
通过设计创新的跨场景匹配任务(如图2b所示),研究人员发现人类能准确匹配不同动态场景中布料的刚度(66%准确率),但质量判断却处于随机水平(51%)。

"Woven": a physics-based probabilistic model
Woven模型通过物理模拟生成布料动态(图3a),并采用后验预测分布(公式2)进行概率推断。

该模型在刚度任务中与人类判断高度相关(r=0.84),显著优于DNN模型(r=0.49)。多维尺度分析显示(图4c-d),Woven与人类感知空间的一致性达0.74,而DNN仅0.25。

Explaining human mass judgments
研究揭示质量判断失败源于物理属性的不对称性:刚度推断准确且偏离先验均值,而质量推断易受风力等外部因素干扰(图6b)。

这种模式被Woven精准预测,而DNN则完全无法解释(图5h)。

这项研究确立了直觉物理学在软物体视觉处理中的核心地位,突破性地证明:1) 人类视觉系统通过物理模拟而非单纯图像统计来理解软物体;2) 跨属性推理的不对称性反映概率推理的本质特征;3) 类人视觉模型需整合生成式物理模拟。该框架可扩展至液体、弹性体等多材料场景的感知研究,为发展具身AI的物理推理能力奠定理论基础。研究团队特别指出,未来工作将结合变分自编码器等技术,进一步探索纹理信息与物理属性的联合表征机制。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号