约克大学发现即使是最聪明的人工智能模型也无法匹配人类的视觉处理

生物通官微
陪你抓住生命科技
跳动的脉搏

生物通首页 > 今日动态 > 正文

【字体：大中小】 时间：2022年09月19日 来源：iScience

编辑推荐：

　　约克大学今天发表的一项研究的合著者James Elder教授说，深度卷积神经网络(DCNNs)不像人类那样使用配置形状感知来观察物体，这在现实世界的人工智能应用中可能是危险的。发表在《细胞出版社》杂志《iScience》上的深度学习模型未能捕捉到人类形状感知的配置本质，该研究采用了被称为“弗兰肯斯坦”的新视觉刺激来探索人类大脑和dcnn如何处理整体的、配置对象属性。

约克大学发表的一项研究的合著者詹姆斯·埃尔德教授说，深度卷积神经网络(DCNNs)不像人类那样使用配置形状感知来观察物体，这在现实世界的AI应用中可能是危险的。

《深度学习模型未能捕捉到人类形状感知的配置本质》是由Elder和芝加哥洛约拉学院的助理心理学教授Nicholas Baker共同进行的一项合作研究，该研究发表在《细胞出版社》杂志《iScience》上。Elder是人类与计算机视觉约克研究主席，也是约克人工智能与社会中心的联合主任，他是芝加哥洛约拉学院的助理心理学教授，也是约克大学的前VISTA博士后。

这项研究使用了被称为“弗兰肯斯坦”的新型视觉刺激来探索人类大脑和dcnn如何处理整体的、配置的对象属性。

埃尔德说:“弗兰肯斯坦只是一种被拆开后以错误的方式重新组装的物体。”“结果，它们拥有所有正确的地方特色，但却出现在了错误的地方。”

研究人员发现，人类的视觉系统被“科学怪人”搞糊涂了，而dcnn却没有——揭示了对配置对象属性的不敏感。

“我们的研究结果解释了为什么深度AI模型在某些条件下会失败，并指出需要考虑物体识别以外的任务，以便理解大脑中的视觉处理，”Elder说。“在解决复杂的识别任务时，这些深度模型倾向于走‘捷径’。虽然这些捷径在很多情况下可能有效，但在我们目前与行业和政府合作伙伴合作的一些现实AI应用中，它们可能是危险的，”Elder指出。

其中一个应用就是交通视频安全系统:“在繁忙的交通场景中，车辆、自行车和行人等物体相互阻碍，在司机的眼中，它们是一堆互不相干的碎片，”埃尔德解释说。“大脑需要正确地将这些碎片分组，以识别物体的正确类别和位置。一个用于交通安全监测的人工智能系统，如果只能感知单个碎片，将无法完成这项任务，可能会对脆弱的道路用户造成误解。”

根据研究人员的说法，为了使网络更像大脑而对训练和架构进行的修改并没有导致配置处理，而且没有一个网络能够准确地预测一次又一次的人类对象判断。埃尔德指出:“我们推测，为了匹配人类的配置敏感性，网络必须经过训练，以解决类别识别以外的更广泛的对象任务。”

约克大学是一所现代化、多校区的城市大学，位于安大略省多伦多市。我们拥有多元化的学生、教师、员工、校友和合作伙伴，以独特的全球视角帮助解决社会挑战，推动积极的变革，为学生的成功做好准备。约克大学的全双语格兰登校区是南安大略法语和双语高等教育卓越中心的所在地。约克大学在哥斯达黎加和印度的校区为学生提供了卓越的跨国学习机会和创新项目。齐心协力，我们就能为我们的社区、我们的星球和我们的未来做正确的事情。

热点排行

新闻专题

联系信箱：

粤ICP备09063491号