受大脑启发的人工智能突破：让电脑看东西更像人类

生物通首页 > 今日动态 > 正文

【字体：大中小】 时间：2025年04月24日 来源：AAAS

编辑推荐：

　　延世大学基础科学研究所（IBS）和马克斯普朗克研究所的研究人员开发了一种新的人工智能（AI）技术，使机器视觉更接近人类大脑处理图像的方式。这种被称为Lp-Convolution的方法提高了图像识别系统的准确性和效率，同时减少了现有AI模型的计算负担。

延世大学基础科学研究所（IBS）和马克斯普朗克研究所的研究人员开发了一种新的人工智能（AI）技术，使机器视觉更接近人类大脑处理图像的方式。这种被称为Lp-Convolution的方法提高了图像识别系统的准确性和效率，同时减少了现有AI模型的计算负担。

弥合cnn和人类大脑之间的差距

人类大脑在识别复杂场景中的关键细节方面非常高效，这是传统人工智能系统难以复制的能力。卷积神经网络（cnn）——用于图像识别的最广泛的人工智能模型——使用小的方形过滤器处理图像。虽然有效，但这种严格的方法限制了他们在碎片数据中捕获更广泛模式的能力。

最近，视觉变形器（ViTs）通过一次分析整个图像显示出卓越的性能，但它们需要大量的计算能力和大型数据集，这使得它们在许多实际应用中不切实际。

受大脑视觉皮层如何通过圆形、稀疏的连接选择性地处理信息的启发，研究小组寻求了一个中间地带：一种类似大脑的方法能让cnn既高效又强大吗？

介绍lp -卷积：一种更聪明的视觉方式

为了回答这个问题，该团队开发了Lp-Convolution，这是一种使用多元p广义正态分布（MPND）动态重塑CNN滤波器的新方法。与使用固定方形滤波器的传统cnn不同，Lp-Convolution允许AI模型根据任务调整其滤波器形状——水平或垂直拉伸，就像人类大脑如何选择性地关注相关细节一样。

这一突破解决了人工智能研究中一个长期存在的挑战，即大核问题。简单地增加cnn的过滤器大小（例如，使用7×7或更大的内核）通常不会提高性能，尽管增加了更多的参数。lp -卷积通过引入灵活的、受生物启发的连接模式来克服这一限制。

现实世界的表现：更强大，更智能，更稳健的AI

在标准图像分类数据集（CIFAR-100, TinyImageNet）的测试中，Lp-Convolution显著提高了经典模型（如AlexNet）和现代架构（如RepLKNet）的准确率。该方法还被证明对损坏数据具有高度鲁棒性，这是现实世界人工智能应用中的一个主要挑战。

此外，研究人员发现，当他们的方法中使用的lp掩模类似于高斯分布时，人工智能的内部处理模式与生物神经活动密切匹配，这一点通过与小鼠大脑数据的比较得到了证实。

基础科学研究所认知与社会中心主任c·贾斯汀·李（C. Justin LEE）博士说：“我们人类在拥挤的场景中很快就能发现重要的事情。”“我们的lp -卷积模拟了这种能力，允许人工智能灵活地专注于图像中最相关的部分——就像大脑一样。”

影响及未来应用

与之前的努力不同，要么依赖于小型的刚性滤波器，要么需要大量资源的变压器，Lp-Convolution提供了一个实用、高效的替代方案。这一创新可能会彻底改变以下领域：

-自动驾驶，人工智能必须快速实时检测障碍物

-医学成像，通过突出细微细节来改进基于人工智能的诊断

-机器人技术，在不断变化的条件下实现更智能、更适应的机器视觉

“这项工作是对人工智能和神经科学的有力贡献，”主任C.贾斯汀李说。“通过将人工智能与大脑更紧密地结合在一起，我们为cnn释放了新的潜力，使它们更聪明、更适应环境，在生物学上更逼真。”

展望未来，该团队计划进一步完善这项技术，探索其在复杂推理任务中的应用，如解谜（如数独）和实时图像处理。

这项研究将在2025年国际学习表征会议（ICLR）上发表，研究团队已经公开了他们的代码和模型：

https://github.com/jeakwon/lpconv/。

热点排行

联系信箱：

粤ICP备09063491号