当前位置: 首页 » 资讯 » 新科技 » 正文

脑细胞组成的计算机跑起了《毁灭战士》!代码全部开源

IP属地 中国·北京 DeepTech深科技 时间:2026-03-02 18:55:58

2026 年 2 月底,澳大利亚生物科技公司 Cortical Labs 在 YouTube 上发布了一段视频。视频里,大约 20 万个活体人类神经元正在玩 1993 年的经典第一人称射击游戏《毁灭战士》(Doom)。屏幕上,Doomguy 跌跌撞撞地穿行在走廊中,偶尔开枪,偶尔转向,偶尔撞墙。

观感更像一个从未碰过电脑的新手在胡乱摸索。但操控这一切的确实不是人手,也不是传统意义上的 AI 算法,而是一团培养在多电极阵列(Multi-Electrode Array, MEA)上的人体神经细胞。


图丨CL1(Cortical Labs)

Cortical Labs 和它的 CL1 生物计算机,读者可能已有所了解——这家公司 2022 年凭借“DishBrain”实验成名,当时他们让培养在芯片上的约 80 万个神经元学会了玩 Pong。

那篇与伦敦大学学院 Karl Friston 教授合作的论文发表在《Neuron》期刊上,实验设计的核心框架来自 Friston 的自由能原理(Free Energy Principle, FEP):神经元做出“正确”动作时收到可预测的电信号反馈,做错了则收到随机刺激。细胞会自发调整放电模式来让环境变得更可预测,学习在五分钟内就出现了,而标准的深度强化学习算法做同样的事大约需要 90 分钟。

从 DishBrain 到商用的 CL1,电极从 8 个升至 59 个,延迟降到亚毫秒级,内置了完整的生命维持系统,神经元可存活最多六个月。单机售价 35,000 美元,30 台机架版单台 20,000 美元,整架功耗不到 1,000 瓦。首批 115 台设备 2025 年开始出货。

让神经元从 Pong 跳到 Doom,难度有质的飞跃。Pong 是二维的,空间关系简单直接。Doom 是三维迷宫,有敌人、武器、弹药、走廊拐角,信息密度完全不在一个量级。CTO David Hogan 在视频中解释了基本原理:独立研究者 Sean Cole 把游戏画面转化为电刺激模式输入神经元,神经元的放电活动被解码为游戏操作指令,特定模式对应射击,另一种模式对应移动。

Cole 通过 Cortical Labs 的 API,在不到一周内完成了 Doom 版本的编写。Cortical Labs 将这种协作框架命名为“皮层云”(Cortical Cloud),允许全球开发者通过 Python 接口远程访问 CL1 上的神经元。


(Cortical Labs)

尽管它玩得磕磕绊绊,如 Kagan 所说:“它是电竞冠军吗?绝对不是。”但他强调的重点是:Cortical Labs 已经解决了“接口问题”,即如何实时地与生物神经元进行双向通信,并训练和塑造它们的行为。

如果只看官方视频和多数媒体报道,我们可能会对这件事的技术实质产生一种偏乐观的认知。但值得注意的是,随演示一同发布在 GitHub 上的代码仓库里,Sean Cole 在 README 中记录了一个关键问题:他编写的解码器(把神经元放电信号映射为游戏动作的 PyTorch 模型)有一种趋势,会逐渐变成一个“策略头”(policy head)。也就是说,运行在普通硅基硬件上的软件模块可能正在学习绕过神经元,自己独立完成游戏决策。

整个系统的架构是:游戏画面被翻译为电刺激传给神经元,神经元的脉冲计数送入 PyTorch 解码器,解码器输出游戏操作。而 PPO(Proximal Policy Optimization,近端策略优化)智能体、CNN 编码器、整个奖励循环,全部运行在外部的普通计算机上。Cole 在代码注释中表示:CL1 设备“不执行任何计算”,只负责接收刺激指令、施加到神经元、把脉冲计数发回来。

所以,CL1 作为硬件接口工作正常,双向通信的延迟和稳定性已达到可用水平。但 20 万个人类神经元到底在多大程度上承载了游戏策略,还是仅仅在“搭便车”,这个问题的答案我们不得而知。

因此我们有必要从两个层面来区分 Cortical Labs 此次的成就。工程层面:他们建造了一套可商用的、能让活体神经元在闭环系统中实时参与计算的硬件平台,这在生物计算领域是独一无二的。认知和计算层面:神经元是否在执行某种真正的策略推理或目标导向学习。

Cole 在 GitHub 仓库的 FAQ 中部分回应了这个疑问:视频中展示的游戏画面是用零偏置线性解码器录制的,也就是说,游戏动作完全是 CL1 输出脉冲的线性函数;当切换到消融模式(随机脉冲或零脉冲)时,学习效果消失。这个回应有一定说服力,但还算不上铁证。

线性解码器加零偏置的设计确实限制了解码器端的自主学习能力,但整个编码器(那个决定以什么模式刺激神经元的 CNN)仍然是通过 PPO 策略梯度在硅基端训练的。换句话说,哪怕神经元确实在对信号做出有意义的响应,当前系统中“智能”的归属权仍然是模糊的:是神经元在学习玩游戏,还是硅基端的强化学习算法在学习如何利用神经元?

官方宣传倾向于暗示前者,但 GitHub 上的证据显示这一点远未验证。曼彻斯特大学计算机科学教授 Steve Furber 在接受采访时也指出,我们目前还不完全理解神经元如何在玩这个游戏、它们如何“知道”被期望做什么。

Cortical Labs 将自己的技术路线命名为“合成生物智能”(Synthetic Biological Intelligence, SBI),刻意与“人工智能”区分。背后有一个技术假设:真实神经元的自组织能力、样本效率和能量效率,可能在某些维度上是硅基模拟神经网络难以企及的。

DishBrain 实验中五分钟出现学习信号的数据,在样本效率上给出了初步支撑。但从 Pong 到 Doom 再到真实世界任务,中间隔着可扩展性、可靠性和可重复性的巨大鸿沟。20 万个神经元听起来很多,但人类大脑有约 860 亿个。

一台 CL1 的神经元数量,大致相当于一只果蝇大脑的规模。而在这条赛道上,瑞士的 FinalSpark 也在做基于人类神经元的计算平台,采用多巴胺等化学奖励信号来训练。Kagan 评价这种方法在实验室可行,但扩展性有限。两条路径谁更有前途,目前没有定论。

那么这次演示到底证明了什么?它证明了 CL1 的硬件接口和通信协议有效,活体神经元可以在实时闭环系统中被稳定地刺激和读取,而且这套流程已经开放到了第三方开发者可以在一周内完成复杂游戏适配的程度。这是一个扎实的工程进展。

它同时产生了一个比它自身更重要的问题:在这样的系统中,生物层到底在做什么?是在真正参与决策,还是作为一个被数字系统绕过的中继节点?Cole 的消融测试为回答这个问题提供了方法论工具,但答案还尚未被揭晓。

参考资料:

1.https://github.com/SeanCole02/doom-neuron

2.https://youtu.be/yRV8fSw6HaE

3.https://gizmodo.com/a-dish-of-neurons-playing-doom-is-the-wildest-thing-ive-seen-in-ages-2000727674

运营/排版:何晨龙

免责声明:本网信息来自于互联网,目的在于传递更多信息,并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益,请及时联系我们,本站将会在24小时内处理完毕。

全站最新