受大脑启发的人工智能突破:让电脑看东西更像人类

【字体: 时间:2025年04月24日 来源:AAAS

编辑推荐:

  延世大学基础科学研究所(IBS)和马克斯普朗克研究所的研究人员开发了一种新的人工智能(AI)技术,使机器视觉更接近人类大脑处理图像的方式。这种被称为Lp-Convolution的方法提高了图像识别系统的准确性和效率,同时减少了现有AI模型的计算负担。

  

延世大学基础科学研究所(IBS)和马克斯普朗克研究所的研究人员开发了一种新的人工智能(AI)技术,使机器视觉更接近人类大脑处理图像的方式。这种被称为Lp-Convolution的方法提高了图像识别系统的准确性和效率,同时减少了现有AI模型的计算负担。

弥合cnn和人类大脑之间的差距

人类大脑在识别复杂场景中的关键细节方面非常高效,这是传统人工智能系统难以复制的能力。卷积神经网络(cnn)——用于图像识别的最广泛的人工智能模型——使用小的方形过滤器处理图像。虽然有效,但这种严格的方法限制了他们在碎片数据中捕获更广泛模式的能力。

最近,视觉变形器(ViTs)通过一次分析整个图像显示出卓越的性能,但它们需要大量的计算能力和大型数据集,这使得它们在许多实际应用中不切实际。

受大脑视觉皮层如何通过圆形、稀疏的连接选择性地处理信息的启发,研究小组寻求了一个中间地带:一种类似大脑的方法能让cnn既高效又强大吗?

介绍lp -卷积:一种更聪明的视觉方式

为了回答这个问题,该团队开发了Lp-Convolution,这是一种使用多元p广义正态分布(MPND)动态重塑CNN滤波器的新方法。与使用固定方形滤波器的传统cnn不同,Lp-Convolution允许AI模型根据任务调整其滤波器形状——水平或垂直拉伸,就像人类大脑如何选择性地关注相关细节一样。

这一突破解决了人工智能研究中一个长期存在的挑战,即大核问题。简单地增加cnn的过滤器大小(例如,使用7×7或更大的内核)通常不会提高性能,尽管增加了更多的参数。lp -卷积通过引入灵活的、受生物启发的连接模式来克服这一限制。

现实世界的表现:更强大,更智能,更稳健的AI

在标准图像分类数据集(CIFAR-100, TinyImageNet)的测试中,Lp-Convolution显著提高了经典模型(如AlexNet)和现代架构(如RepLKNet)的准确率。该方法还被证明对损坏数据具有高度鲁棒性,这是现实世界人工智能应用中的一个主要挑战。

此外,研究人员发现,当他们的方法中使用的lp掩模类似于高斯分布时,人工智能的内部处理模式与生物神经活动密切匹配,这一点通过与小鼠大脑数据的比较得到了证实。

基础科学研究所认知与社会中心主任c·贾斯汀·李(C. Justin LEE)博士说:“我们人类在拥挤的场景中很快就能发现重要的事情。”“我们的lp -卷积模拟了这种能力,允许人工智能灵活地专注于图像中最相关的部分——就像大脑一样。”

影响及未来应用

与之前的努力不同,要么依赖于小型的刚性滤波器,要么需要大量资源的变压器,Lp-Convolution提供了一个实用、高效的替代方案。这一创新可能会彻底改变以下领域:

-自动驾驶,人工智能必须快速实时检测障碍物

-医学成像,通过突出细微细节来改进基于人工智能的诊断

-机器人技术,在不断变化的条件下实现更智能、更适应的机器视觉

“这项工作是对人工智能和神经科学的有力贡献,”主任C.贾斯汀李说。“通过将人工智能与大脑更紧密地结合在一起,我们为cnn释放了新的潜力,使它们更聪明、更适应环境,在生物学上更逼真。”

展望未来,该团队计划进一步完善这项技术,探索其在复杂推理任务中的应用,如解谜(如数独)和实时图像处理。

这项研究将在2025年国际学习表征会议(ICLR)上发表,研究团队已经公开了他们的代码和模型:

https://github.com/jeakwon/lpconv/。


相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号