当前位置: 首页 » 资讯 » 新科技 » 正文

首个生物合理性语言模型诞生!MIT博后用神经架构实现类人学习

IP属地 中国·北京 编辑:赵云飞 DeepTech深科技 时间:2025-07-21 20:18:27

诺奖得主、美国科学家理查德·阿克塞尔(Richard Axel)曾表示,当前人们依旧不清楚神经活动转化为思维和行动的背后逻辑。他认为,洞察这一逻辑是神经科学未来最重要的发展方向。

语言、推理和规划等认知现象是神经元和突触活动的直接产物,但是目前尚无一个可以统领全局的理论来解释这一过程的实现机制。阿克塞尔使用“逻辑”一词似乎是在表示人们应当从日益增长的神经科学知识中,找出足以支撑大脑功能实现的基本元素。

近日,美国哥伦比亚大学博士毕业生、目前在美国麻省理工学院从事博士后研究的丹尼尔·米特罗波尔斯基(Daniel Mitropolsky)打造了一款名为 NEMO 的极简大脑神经模型。其表示,这是首个具有生物合理性的语言学习系统。该系统能通过接触少量与现实情境相关联的句子,在不限语言的前提下习得自然语言的基本要素,包括词汇、基础句法及语义知识。


(https://dmitropolsky.github.io/)

同时,本次系统可被扩展至多语言处理:只需新增一个功能区域,就能为用户所掌握的语言配置专属处理组件。研究人员相信这套语言习得系统之所以具有生物学合理性,不仅是因为其严格地遵循着 NEMO 框架,更是因为它的白板式大脑架构所包括的功能分区和连接纤维,完全可能通过哺乳动物的发育过程来实现自然形成。



NEMO:基于神经科学的六个原则打造而来

据介绍,NEMO 基于神经科学中六个基础且无争议的原则构建了一个简单数学表述,它们分别是:兴奋性神经元、大脑区域、随机突触连接、每个区域内的局部抑制、赫布可塑性和区域间抑制。NEMO 模型能以极高的效率进行模拟,其模拟规模可达数千万个神经元和数万亿个突触。

研究人员通过实验发现 NEMO 符合阿克塞尔所说的那种抽象理论,并且能够完成自然语言习得的这一动物大脑最为明显的功能之一。与此同时,数学证明以及相关模拟也都证明,该模型能够通过神经集合的形成与操控来执行基本计算,并能完成多种认知类任务比如解析自然语言句子等任务。然而,NEMO 能够这样运行前提是:语言中的词汇已经由神经集群进行了表征,并且其突触连接已经编码了各个单词的语法角色。


(https://arxiv.org/pdf/2507.11788)

如前所述,研究人员通过实验证明一个处于白板状态的 NEMO 系统能以一种类似于人类语言习得的方式来学习一门语言的词汇、句法和语义。具体而言,其通过接触那些有着具体依据的语言学会了以下四种本领:第一,学会了具体名词和动词的语义表征;第二,学会了基本的句法特征,例如每个词的词性;第三,学会了多种语气之下的语言词序;第四,学会了生成新句子。

当然,语言习得的内涵远不止于此。完整的语言习得描述必须涵盖以下方面:

学会语音与音素习得(比如发音方式、音位对比);学会词性分类(能够掌握除了名词、动词外的其他词类,比如形容词、副词和介词等);功能词(比如冠词“the”、连词“and”等);抽象词汇(比如“love”“freedom”等表示情感或概念的词汇);句法结构(能够掌握超越基础词序的复杂句型,比如从句和倒装句等)。

在婴儿的大脑中,上述学习都会以微妙的方式交织在一起。然而,鉴于本次研究的目标是在严格控制的实验中,验证 NEMO 系统是否具备基础的语言习得能力,因此他们将重点放在完成统计学习任务上,并分为两个阶段进行:首先让其学习词义与词性,然后让其学习词序规则并产生句子生成能力。

而在语音和语音学方面,研究人员通过采用“输入 - 输出约定”来绕过了如下阶段:即向系统呈现一个句子时,系统会将其转化为与词语符号对应的刺激序列,而生成句子时也是如此。

实验中,系统会接触到有依据的、由自然语言呈现的、与具体情境相关联的完整句子。“有依据”的意思是,每个句子在呈现时,与该句子相对应的表征在感觉皮层和运动皮层中都处于激活状态。也就是说,当输入句子“狗在跑”时,研究人员假设运动前皮层中与“跑”相关的镜像细胞以及下颞叶视觉皮层中通用的狗的表征都处于激活状态。


(https://arxiv.org/pdf/2507.11788)

此前有研究表明,在之前另外一种符合生物学现实的大脑模型中,名词、动词及其含义可以通过有实际依据的呈现方式来习得。然而,那项研究仅仅涉及到学习孤立单词这种比较简单的任务,并没有涉及到句法和上下文。众所周知,非人类灵长类动物也可以达到这种语言水平。而在本次研究之中,研究人员攻克了一个更加具有挑战性的难题——即通过接触有依据的完整句子,让系统能够习得词汇语义、动名词语法区分以及词序规则。

需要说明的是,这一能力目前仍然是人类所独有的认知特征。因此,研究人员认为他们构建出了首个在生物学上具有合理性、且能进行基本语言习得的人工模型。倘若未来人们能在非人类动物身上发现此类语言能力,那么研究人员相信这一发现将从根本上改变当前关于语言排他性的普遍观点。



语言的生物学基础是什么?

除了回应前文提及的阿克塞尔所说的“逻辑”之外,本次研究还涉及到另一个长期存在的根本性问题:即语言的生物学基础是什么?

具体而言,语言是否是人类在基因、分子或神经层面所拥有的独特特征的产物?事实上,这些特征包括科学家于此前发现的、一度被称为“语言基因”FOXP2 基因,以及科学家最近在人类第 2-3 层神经元中发现的新型树突电位,这些发现引发了人们对于人类语言能力生物学根源的猜测。而本次研究所提出的生物合理性语言习得系统,可被视为是另一种替代性零假设的实证:即基于简单且广受认可的神经科学要素与原理,语言系统完全能在哺乳动物大脑的基础上构建而来。

研究人员指出,他们所提出的特定神经架构和算法,可被视为是一个关于人类语言系统的全面的、且符合神经生物学可行性的假设,而在这一领域此前鲜有如此具体的模型。研究人员表示,本次模型所涉及的脑区(包括其数量、功能及突触连接方式),与现有神经解剖学和心理语言学的证据及观点是互相兼容的,并在已经具备学界共识的领域体现了这种一致性。与此同时,此次提出的人工语言系统能够预测这些脑区在语言理解与生成过程中的激活模式,因此这一特性或将为神经语言学研究提供重要参考。

相比目前已经得到广泛使用且具备语言能力的另一类计算系统——大模型,本次系统有一个重要区别:即具备生物学上的合理性。尤其是它并不依赖反向传播这一当前机器学习领域中最为关键的机制,而且这种机制此前在动物大脑中从未被观察到。


(https://arxiv.org/pdf/2507.11788)



助力人类语言系统的进一步研究

当然,本次系统并未涵盖语言的所有方面,比如语音和音系的学习被加以略过,形容词、副词以及功能范畴也未被纳入考量。研究人员认为,通过针对现有系统进行简单扩展,便可涵盖许多未被涉及的方面。

研究人员表示,抽象词汇是下一步研究的关键目标,这需要建立相应的表征框架,并引入新的语义处理脑区。目前,已有许多关于人类大脑如何处理抽象词汇的认知语言学理论,这些理论可被用于指导这一领域的新研究。语言能力的其他复杂方面比如歧义消解、语法性判断、隐喻理解及下一词预测等,都是极具研究价值的进阶挑战。尽管其中部分任务可能需要针对 NEMO 模型进行一些符合生物机理的扩展,但是研究人员坚信这些挑战均能在现有框架之下得到解决。

未来,研究人员的更多探索目标包括:掌握语言的社会化使用,探索语言与社会认知要素的交互机制,预计这些研究需要建立新型的表征系统与处理机制。此外,研究人员认为很有必要探索 NEMO 模型与大模型之间的交互,这有助于 NEMO 模型在这些更具挑战性的方向上发展。除了语言能力外,各类推理形式比如逻辑推理、启发式推理、范畴推理、概率推理等,都将成为 NEMO 体系面临的重要进阶挑战。

尽管未来存在诸多研究方向,且依然存在一些局限性,但是研究人员此次提出的基于 NEMO 的基础语言习得人工系统是同类系统中的第一个,除了能够起到概念验证的价值之外,该系统或许还能为神经语言学研究提供帮助。由于其设计原理能在很大程度上反映当前神经语言学的思想,因此通过生成可验证的预测和部署更高级的版本,或将有助于指导对于人类语言系统的进一步研究。

参考资料:

https://arxiv.org/pdf/2507.11788

https://www.engineering.columbia.edu/faculty-staff/directory/christos-papadimitriou

https://dmitropolsky.github.io/

运营/排版:何晨龙

免责声明:本网信息来自于互联网,目的在于传递更多信息,并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益,请及时联系我们,本站将会在24小时内处理完毕。