不了解新皮质的工作原理,就不可能建造真正的人工智能。深度学习在走弯路。
他既懂工程实现,又能理解神经科学实验数据,能把 Vernon Mountcastle 的 1978 年发现变成可计算的理论。
"新皮质由重复的皮质柱构成,每个皮质柱执行同一套算法。" —— 这个预言等了 Hawkins 40 年来兑现。
传统观点:眼睛拍照→大脑处理图像。但实际上大脑 95% 的时间在预测,感官输入只是用来纠错。
深度学习的底层逻辑:简单特征→复杂特征。但新皮质不是单纯的前馈层级网络,每层都有大量反向连接。
传统认为视觉区专管视觉、语言区专管语言。但 Hawkins 发现:每个皮质柱运行同一算法,区别只在接收什么输入。
大脑不断生成对下一个感觉输入的预测。当预测失败时,大脑才"惊醒"更新模型。这与深度学习的被动训练范式截然不同——智能的本质是主动建模,而不是被动分类。
皮质柱在每次感觉输入到达之前,已经产生了预测。感觉输入只是验证或纠正这个预测。大脑 80% 的神经连接是自顶向下的反馈,而非自底向上的前馈。
皮质柱通过主动运动来建立模型。转动手指感受物体轮廓时,每次运动-感觉的组合都在强化参考框架中的模型。静止观察无法实现深度学习。
当预测错误时(预期 A 但感知到 B),大脑产生预测误差信号,触发模型更新。"专注力"其实是大脑在密集处理预测失败的区域。
不论是物理对象(咖啡杯的把手在哪)、还是抽象概念(民主的"位置"在政治空间里),大脑都用坐标系来编码知识。
海马区的位置细胞(Place Cells)和网格细胞(Grid Cells)不仅用于导航,而且是所有知识编码的模板。这是书中最深刻的发现。
当你思考"民主的局限性"时,你的大脑在参考框架中移动位置——就像手指探索物体一样。语言理解是运动导航。
视觉皮层处理颜色、形状、运动分布在不同区域。为什么我们感知到的是统一的"红色移动的球",而不是破碎的感觉碎片?
每根皮质柱的 Layer 2/3 有专属的投票神经元,它们通过长程连接与其他皮质柱通信,形成多数共识。只有当多数皮质柱同意时,感知才会浮现。
你的"统一意识体验"是15万个皮质柱投票的稳定状态。当这个投票状态稳定,你"感知"到了。当它不稳定(如视觉错觉),你会迷惑。
【事实】 深度学习在图像分类、自然语言处理上表现卓越。 【观点】 Hawkins 认为它本质上是"高级曲线拟合",缺乏真正的世界模型和参考框架,无法实现具身学习(Embodied Learning)。他预测深度学习会遇到根本性的能力天花板。
当皮质柱投票达成稳定的全局共识时,意识体验浮现。这解释了为什么意识有延迟(投票需要时间),以及为什么注意力是有限的。
"自我"是大脑中最稳定、最持久的参考框架模型。它不是独立的实体,而是所有其他参考框架共同参照的那个中心坐标系。
数学推导、哲学思考、策略制定——都是大脑在抽象参考框架中移动位置。"理解"意味着在概念空间中找到稳定坐标。
Hawkins 的解释属于物理主义(Physicalism)——意识是大脑物理过程的涌现属性,无需额外"灵魂"或"量子效应"。Hard Problem of Consciousness 在他看来是可解的工程问题。
批评者认为他跳过了 Hard Problem——"为什么"这些物理过程产生主观体验?他的理论更多是神经相关物(Neural Correlates),尚未完全回答现象意识。
控制饥饿、恐惧、性欲、领地意识。对新皮质的建议可以直接否决。
明知抽烟有害但停不下来;清楚该去运动却刷手机;理性告诉你冷静,情绪却失控爆发——这些都是两套系统在争夺控制权。
语言、科学、艺术、道德全在这里。但它的指令不能直接覆盖旧脑。
人类文明的大多数问题(战争、气候变化、政治极化)都根植于旧脑的短视本能战胜了新皮质的长远模型。AI 的危险也在这里——我们可能把旧脑的目标编进了机器。
Hawkins 团队正在构建皮质柱算法的硬件实现,目标是创建能够在三维空间中主动导航并构建参考框架模型的 AI 系统。不是 GPT 的路径。
Hawkins 认为 AI 本身不会产生自主"生存欲",真正的危险是人类将旧脑目标(权力、资源、部落主义)编入 AI 系统——通过数据污染、目标函数设计或人为滥用。
智能最终会脱离生物载体,以知识胶囊(Knowledge Capsules)的形式存在——不依赖硬件,可在宇宙中传播。这是大脑进化的终极延伸,而非科幻。