第1个回答 2024-08-18
在计算生物学领域,研究人员一直以来都在探索人工智能与人类智能之间的差异与相似之处。最近,加州理工学院计算与神经系统系的研究人员Matt Thomson带领其团队,发表了一篇突破性论文,揭示了神经网络在构建空间意识方面的能力。这篇论文于7月18日刊载于《自然 - 机器智能》杂志,揭示了神经网络通过一种叫做预测编码的算法,能够构建类似人类大脑中的空间地图。
为了验证这一理论,Thomson和他的团队在《我的世界》(Minecraft)游戏中构建了复杂的环境,并设计了环境中的树木、河流和洞穴等元素。他们记录了玩家随机穿越该区域的视频,并以此训练了一个配备预测编码算法的神经网络。研究发现,经过训练的神经网络不仅能够学习游戏世界中物体之间的组织关系,还能预测在空间移动时遇到的环境,准确度仅0.094%的均方误差,远低于其他AI系统。
更有趣的是,研究团队“解码”了神经网络,发现各种物体的表示是相对空间进行存储的,这意味着神经网络实际上“绘制”出了游戏环境的地图。这种能力使得神经网络能够像人类一样解决复杂问题,而不是像传统AI那样仅仅执行预定的指令。这一成果展示出人工智能在空间感知上的巨大潜力,未来可能在自动驾驶汽车、虚拟现实等领域发挥重要作用。
加州理工学院计算与神经系统项目为James Gornet提供了独特的研究平台,让他能够从事其他地方无法完成的工作。Gornet是该系的学生,其工作涵盖了神经科学、机器学习、数学、统计学和生物学等多个领域。Thomson教授强调,通过模仿大脑的特性来设计人工神经网络,他们希望最终能够深入理解人类大脑的工作原理。加州理工学院的学术环境鼓励这种跨学科研究,为科学家们提供了探索未知领域的宽广平台。
预测编码神经网络的实现,通过灵感来自预测编码推理问题中的隐式空间表示,构建了一个计算实现的预测编码智能体,以研究该智能体在探索虚拟环境时学习到的空间表示。研究者首先在Minecraft的Malmo环境中创建了环境,设计了包含山洞、森林和河流等元素的物理环境,以提供全局视觉地标、相似性以及限制移动路径的条件。智能体遵循路径并接收每条路径上的视觉图像,以进行预测编码。
为了实现预测编码,研究者开发了一个编码器-解码器卷积神经网络,采用ResNet-18架构,构建了编码器和解码器,并使用U-Net架构将编码的潜在单元传递到解码器中。多头注意力处理编码潜在单元序列,以编码过去的视觉观察历史。经过训练,优化后的预测编码器预测图像与实际图像之间的均方误差低至0.094,显示了良好的视觉保真度。
这项研究的更多细节和成果可参考相关论文和链接。