
-
生物通官微
陪你抓住生命科技
跳动的脉搏
受大脑启发的人工智能突破:让电脑看东西更像人类
【字体: 大 中 小 】 时间:2025年04月24日 来源:AAAS
编辑推荐:
延世大学基础科学研究所(IBS)和马克斯普朗克研究所的研究人员开发了一种新的人工智能(AI)技术,使机器视觉更接近人类大脑处理图像的方式。这种被称为Lp-Convolution的方法提高了图像识别系统的准确性和效率,同时减少了现有AI模型的计算负担。
延世大学基础科学研究所(IBS)和马克斯普朗克研究所的研究人员开发了一种新的人工智能(AI)技术,使机器视觉更接近人类大脑处理图像的方式。这种被称为Lp-Convolution的方法提高了图像识别系统的准确性和效率,同时减少了现有AI模型的计算负担。
弥合cnn和人类大脑之间的差距
人类大脑在识别复杂场景中的关键细节方面非常高效,这是传统人工智能系统难以复制的能力。卷积神经网络(cnn)——用于图像识别的最广泛的人工智能模型——使用小的方形过滤器处理图像。虽然有效,但这种严格的方法限制了他们在碎片数据中捕获更广泛模式的能力。
最近,视觉变形器(ViTs)通过一次分析整个图像显示出卓越的性能,但它们需要大量的计算能力和大型数据集,这使得它们在许多实际应用中不切实际。
受大脑视觉皮层如何通过圆形、稀疏的连接选择性地处理信息的启发,研究小组寻求了一个中间地带:一种类似大脑的方法能让cnn既高效又强大吗?
介绍lp -卷积:一种更聪明的视觉方式
为了回答这个问题,该团队开发了Lp-Convolution,这是一种使用多元p广义正态分布(MPND)动态重塑CNN滤波器的新方法。与使用固定方形滤波器的传统cnn不同,Lp-Convolution允许AI模型根据任务调整其滤波器形状——水平或垂直拉伸,就像人类大脑如何选择性地关注相关细节一样。
这一突破解决了人工智能研究中一个长期存在的挑战,即大核问题。简单地增加cnn的过滤器大小(例如,使用7×7或更大的内核)通常不会提高性能,尽管增加了更多的参数。lp -卷积通过引入灵活的、受生物启发的连接模式来克服这一限制。
现实世界的表现:更强大,更智能,更稳健的AI
在标准图像分类数据集(CIFAR-100, TinyImageNet)的测试中,Lp-Convolution显著提高了经典模型(如AlexNet)和现代架构(如RepLKNet)的准确率。该方法还被证明对损坏数据具有高度鲁棒性,这是现实世界人工智能应用中的一个主要挑战。
此外,研究人员发现,当他们的方法中使用的lp掩模类似于高斯分布时,人工智能的内部处理模式与生物神经活动密切匹配,这一点通过与小鼠大脑数据的比较得到了证实。
基础科学研究所认知与社会中心主任c·贾斯汀·李(C. Justin LEE)博士说:“我们人类在拥挤的场景中很快就能发现重要的事情。”“我们的lp -卷积模拟了这种能力,允许人工智能灵活地专注于图像中最相关的部分——就像大脑一样。”
影响及未来应用
与之前的努力不同,要么依赖于小型的刚性滤波器,要么需要大量资源的变压器,Lp-Convolution提供了一个实用、高效的替代方案。这一创新可能会彻底改变以下领域:
-自动驾驶,人工智能必须快速实时检测障碍物
-医学成像,通过突出细微细节来改进基于人工智能的诊断
-机器人技术,在不断变化的条件下实现更智能、更适应的机器视觉
“这项工作是对人工智能和神经科学的有力贡献,”主任C.贾斯汀李说。“通过将人工智能与大脑更紧密地结合在一起,我们为cnn释放了新的潜力,使它们更聪明、更适应环境,在生物学上更逼真。”
展望未来,该团队计划进一步完善这项技术,探索其在复杂推理任务中的应用,如解谜(如数独)和实时图像处理。
这项研究将在2025年国际学习表征会议(ICLR)上发表,研究团队已经公开了他们的代码和模型:
https://github.com/jeakwon/lpconv/。
生物通微信公众号
知名企业招聘