2024年被称为“人形机器人元年”。很多人预测,随着机器人大规模出现在普通人的家居生活环境中,人与机器人之间进行情感交流将成为未来智能社会的常态。所谓机器情感、AI陪伴的实质是什么,对人机交互、人机关系产生何种影响?比如说,从文化视角和性别视角,应该如何看待人机情感关系呢?人与机器的情感交流,将会产生何种社会冲击,导致何种技术风险和技术伦理问题,又应该如何应对?类似问题,已经引发诸多热议。本次笔谈聚焦“机器情感与AI陪伴的人文审度”,从哲学、马克思主义理论、文学和人工智能等进行跨学科研究,抛砖引玉,以期推动该领域研究的进一步发展。
在《建构主义视域下的机器情感》中,刘永谋和白英慧界定机器情感的概念,并从情感智能、人机情感和人机互动三个方面剖析机器情感的建构性,主张机器情感发展的有限主义进路。在《机器如何可能有情感?——基于“以生命为核心”的意识理论的探讨》中,李恒威和曹旭婷指出,基于“以生命为核心”的意识理论,通过模拟生物体的内稳态调节机制,可以为机器赋予情感能力,从而使其具备自主适应性和内在驱动力,为通用人工智能的发展提供新思路。在《人机情感交互的伦理反思及其规约路径——以AI复活技术为例》中,张卫和张陈杰认为AI复活技术使得人机情感交互出现了新的形式,但是由于情感不对称性,会形成情感依赖、情感异化、身份欺骗、认同危机以及情感资本化等伦理僭越风险,需要从制度规约、技术设计和文化调节等视角,寻找AI复活技术发展的向善之道。在《情感人工智能需要“身体”吗?》中,吴静和王隽雅认为当情感AI成为人类寻求情感互动的对象,情感的具身性特征与人类情感交互的复杂规则共同提出了对情感AI拟真性的高需求,这就使得情感AI的“身体”设计需要面临多重认知、伦理和法规上的拷问。在《非人之恋文化史视域下的当代人机恋:渊源、特点与风险》一文中,程林与张玥指出,作为非人之恋4.0阶段,当代人机恋的核心特征是在社会现实青年群体中的日常化和深度化,并具有趣缘性、生成性与游戏性等特点,但其情感和伦理风险也不容忽视。在《超越记忆—情感计算中遗忘的必要性和实现》一文中,邱德钧和李玮农批判当前情感计算中过度理想化的技术假设,提出引入自然衰减与主动选择性遗忘的现象学启发神经计算模型,强调遗忘机制在构建真实、伦理、适应性情感AI中的关键作用。(专题特邀主持:刘永谋)
本系列文章原刊《科学·经济·社会》2025年第3期,澎湃新闻经授权转载。
当前人工智能系统因缺乏主体性体验和内在驱动力,难以在开放环境中实现自主适应。以“机器如何可能有情感”为核心问题,结合达马西奥与索姆斯的“以生命为核心”的意识理论,提出情感机器的构建路径。首先论证意识的本质是生物体维持内稳态的高级调节机制,感受作为连接生理需求与主观体验的生物学基础,为机器情感提供理论依据;进而阐释通过模拟内稳态调节逻辑、设计闭环反馈系统与自主目标生成机制,使机器具备情感效价与适应性动机;最后探讨情感机器的伦理挑战及价值对齐路径。研究表明,赋予机器类生命的内稳态调节能力,可为其情感涌现提供物质基础,为通用人工智能的发展提出一种新思路。
一、AI的情感缺失与意识理论的启示
当前人工智能系统在基于数据的分类、逻辑推理和创造性任务中展现出卓越性能,甚至在一些方面超越人类。然而,其发展亦面临一项根本挑战:作为无生命的符号处理与表征计算体系,现有人工智能缺乏作为主体的根本的现象学表现(phenomenological manifestations),即缺乏对自身存在的内感知(interoception)和相应的主体性体验(subjec-tive experience)。这种“感受缺失”(feeling absence)导致AI系统无法理解维持生存和“安康”(well-being)的核心需求(如饥饿对生存的威胁),亦无法通过情感体验(affective experience)形成内在的行为动机或目标。其直接后果是,AI系统高度依赖人类预设的外部目标函数,既不能像生物体那样通过“痛苦”“愉悦”等主体性感受自主地(autono-mously)驱动行为,也难以在开放环境中发生真正的适应性演化。这种与生物智能的本质差异,不仅揭示了人工智能系统在开放的、复杂动态环境中的脆弱性,更对通用人工智能(AGI)的理论基础与实现可能提出了深层质疑。
然而,神经科学和意识研究领域正在进行的“生命转向”为突破这一困境提供了启示。以雅克·潘克赛普(Jaak Panksepp)、安东尼奥·达马西奥(Antonio Damasio)、比约恩·默克尔(Bjorn Merker)和马克·索姆斯(Mark Solms)为代表的学者突破传统计算主义框架,从生命的存续、安康、适应和演化的生物学视角,重构了意识的本质与功能,形成了一派我们称之为“以生命为核心”的意识理论。这派理论认为:意识并非与生命无关的信息加工的副产品,而是生物体维持和调节内稳态(homeostasis)的一种高级机制,在这个机制中:(1)感受(feeling)扮演着至关重要的角色;(2)感受反映了生物体对其需求状况的评估,其源于神经系统对内稳态变化的实时映射,是内稳态的生理参数转化为情感效价(affective valence)(如疼痛、愉悦)的现象学表现;(3)感受是意识的最初形式,它赋予生物体以自我感(sense of self),是生物体采取适应性的认知—行动的源生驱动力。
若意识本质与生命调节紧密关联,则机器情感的实现需回归生命的底层逻辑——内稳态机制。由此,本文的核心问题得以明确:如何基于“以生命为核心”的意识理论,为机器赋予真正的情感能力?
二、意识的生命本质:内稳态与情感的理论关联
“以生命为核心”的意识理论是我们提出的“心智的生命观”(view of mind from life)在意识研究上的体现。我们认为从生命及其存续、安康、适应和演化等角度对心智本性、机能及其相互关系进行理解和探究的视角为“心智的生命观”。心智的生命观认为,心智本质上是一种生命现象或有机体现象,要全面地理解心智,首先必须深刻认识生命的本性。
(一)内稳态作为生命调节的核心
无论生命的形态是简单的还是复杂的,是低级的还是高级的,它都有一种显而易见的本质,或者说是一个我们不得不接受的现象学事实(phenomenological fact)——生命与自我保存(self-preservation)这一明确的“目标”范畴紧密相连。只要死亡尚未到来,生物体就会不懈地努力维持自身的存在。那么,每个生物体所努力维持和延续的究竟是什么呢?简言之,就是保持“活着”(staying alive)。然而,“活着”这个现象学概念虽然直观明了,但比较笼统。在生理学领域,与“活着”这一直观概念相对应的,是一个更为精确的概念——“内稳态”——“不管多么艰辛,生命都有一种存活和发展的欲望,这种欲望既不是深思熟虑过的,也不是有意为之的,而执行这种欲望所需要的那组协调过程被称为‘内稳态’。”
内稳态思想源于法国生理学家克劳德·伯纳德(Claude Bernard)1865年提出的“内环境”(milieuintérieur)概念。伯纳德发现,高等生物的细胞并非直接接触外界环境,而是通过细胞外液(如血液、淋巴液和组织液)构成的“内环境”间接与外界互动。这一液体环境为细胞提供了温度、化学成分等相对稳定的理化条件,成为生命活动的基础。他提出了一个深刻的命题:“内环境的稳定乃是自由和独立生命的条件”。生物体通过多种生理系统,如神经系统、内分泌系统和免疫系统等,共同参与调节内环境稳态,以维持机体内部环境的稳定,确保细胞获得必要的营养物质和氧气,排出代谢废物。这种调节能力越强,生物体对外部环境的独立性和自由度就越高。温血动物正是凭借其强大的内环境调节机制,实现了“生命现象不再随环境变化而交替”的某种程度的自由状态。
20世纪初,美国生理学家沃尔特·布拉德福德·坎农(Walter Bradford Cannon)在内环境基础上提出“内稳态”概念,强调这是一种通过不断调节体内的各种生理过程来维持的动态平衡。内稳态体现了生命对抗熵增的神奇能力:尽管生物体由不稳定物质构成且持续与外界交换物质,却能通过神经、器官等复杂协调机制维持数十年有序状态。坎农惊叹道,这种开放系统在磨损与修复中保持动态平衡的能力堪称“惊人奇迹”。
从伯纳德的“内环境”到坎农的“内稳态”,生命科学揭示了生物体对抗熵增的核心矛盾——生命既要遵循热力学第二定律,又必须通过精密调节(如体液运输营养物质和废物)来维持远离平衡态的有序性。正如坎农所言,当内环境的波动接近危险的阈值时,生物体会自动触发多种机制,以确保其状态回归至安全范围内。这种自我调节能力不仅保障了个体生存,更为理解复杂系统的适应性提供了范式:从单细胞到高等生物,内稳态机制的完善程度直接决定了生命对抗环境扰动的自由尺度。
(二)达马西奥:内稳态是意识的生物学关键
达马西奥认为,科学家当然可以专注于研究内稳态的(神经)生理机制,但如果不将它与心智的方面(情绪、感受、动机等)联系起来,那么这种研究就错失了内稳态研究本该有的重大意义。与内稳态的纯粹生理学研究不同,达马西奥提出了一个卓越而光辉的见解——“内稳态是意识的生物学关键”。达马西奥的意识理论就是以此为根基建构起来的。
非显性智能。达马西奥认为,早期生物(例如细菌)通过非显性智能(covertintel-ligence)高效地管理生命,这种智能依赖于分子和亚分子过程,无需我们通常以推理为典范的那种智能即可完成复杂的生存任务,如感应(sensing)、识别(detecting)和反应(responding)。非显性智能的特点是非表征的(即不依赖明确的表征和基于表征的推理)、自动化的(直接响应环境或内部变化)。例如,细菌能通过化学感应协调群体行为,植物能调整根系生长以获取水分,而人类的基础代谢和免疫反应也依赖这种智能。
表征、心智与显性智能。神经系统是生命演化后期的产物,其核心功能是协调复杂多细胞生物的功能。通过神经系统的映射能力,生物体能够生成表征或意象(images),从而形成心智(mind)。心智由来自感官输入(视觉、听觉、味觉、嗅觉、触觉、内感知)的时空映射模式(意象)组成,它们既包括对外部世界的感知,也包括对内部状态的感知。这些意象可以被操作,从而形成推理和创造性思维。这种通过意象操作展现出来的智能,被称为显性(overt)智能。人类的言语思维过程是显性智能的高级和典型形式。
感受的独特性。达马西奥认为,感受是生命超越非显性智能管理的关键环节。生物体要能主动地介入对自身生命的管理,那么它首先必须有一种通达和反映自身生命状况的方式或机制。而感受正是这种机制的关键。感受之所以能够做到这一点,是因为感受是一种属于同一个有机体的身体和神经系统互动形成的循环产生的混合性神经映射,是由内感知系统(interoceptivesys-tem,负责监测内部器官状态)与脑特定区域(如脑干和脑岛)之间的复杂交互作用实现的。内感知系统通过无髓鞘轴突和缺乏血脑屏障的结构特性,使身体信号与神经活动直接交融,形成独特的“身体—脑对话”或“身体—脑循环”。达马西奥指出,“感受/感知的实际客体不是别的,正是有机体本身的一部分,这个客体实际上位于主体/感知者内部。”正因为如此,感受与视觉、听觉这类常规的外部感知完全不同,“因为我们感受/感知到的客体与主体存在于同一个有机体中,它们可以相互作用。中枢神经系统可以改变产生特殊感受的身体状态,并以此来调整被感受的事物。这是一个非同寻常的设置,在外部感知的世界里没有可与之相媲美的东西。”
从功能分类上看,感受分为两类:内稳态感受(homeostatic feeling),如饥饿、疼痛,直接反映身体内部平衡状态,评估能量、代谢等生理参数;情绪感受(emotive feeling),如恐惧、愉悦,则由情绪事件触发,通过内脏反应(如心跳变化)在脑中生成。感受的生物学功能在于充当生命状态的“哨兵”,愉悦提示机体健康,疼痛警示潜在危害,并且通过这些情感效价迫使生物体采取适应性行动。可见,感受这种生物功能先于高级认知能力而存在,其影响不仅关乎个体生存,还通过社会化影响群体行为。例如,道德感或共情可能源自内稳态需求的演化,最终受文化规范塑造。此外,达马西奥强调,感受与理性并非对立,而是协同运作,共同指导决策和行为。
感受是最早也是最基本的意识形式。感受因其独特性在达马西奥的意识理论中占据核心地位。“意识,从最基本层次到最复杂层次,就是把客体(即心智内容)与自我(即视角和主观性)聚集在一起的那个统一的心智模式”;“当心智内容,诸如感知和思想,被自发地归属于某个特定的有机体/所有者时,意识就出现了。”换言之,意识不仅仅是拥有心智内容(表征、意象),更重要的是这些内容被自动体验为属于某个个体——一个拥有视角的生物主体。这一论断集中体现了达马西奥意识模型的解释力,其革命性正在于将意识植根于拥有身体的生物体中,而不是将其视为脱离身体的认知现象。这种归属过程构成了感受对意识而言之所以是不可或缺的根本原因。
因此,任何有意识体验必然是两个成分的统一,即“意识=主观性(由感受赋予自我感)+整合的心智内容(提供统一的心智场景)”。相比于意识的体验内容(即整合的心智内容),意识的主观性一直是更难的问题。“当主观性消失,当心智中的意象不再自动被其所有者/主体所认领,意识就无法正常运行。如果我或读者无法以主观视角去把握心智中显现的内容,那么这些内容就会毫无着落地随处飘浮,它们不再属于任何人。谁会知道它们存在呢?意识消失了,这一刻的意义也消失了,存在感也终止了。”如果我们要理解意识是如何形成的,我们必须理解主观性的形成。如前所述,主观性当然包含心智内容所相对的生物个体的视角性,它涉及产生心智内容的身体位置。然而,“由肌肉骨骼框架及其感知门户所产生的视角对建立主观性还不够。除了需要感官视角之外,持续有效的感受是主观性的关键促成因素”。达马西奥提出,将心智内容自动地归属于某个生物个体是由持续不断的感受赋予的。视觉系统可以生成外部世界的精确表征,但只有与内感知结合,这些表征才能被“拥有”,即成为“我的”体验。与无意识的感知——例如,盲视(blindsight)——不同,意识包含归属感(ownership):这是发生在我身上的事或这是我的感知。这意味着,单纯的神经活动(如视觉皮层的激活)不足以产生意识,只有当这些表征与身体状态(如心跳、内脏信号)结合时,才会形成主观体验。
当映射当前生命内部状态的感受被“置于”甚至被“定位”到整个机体的当前视角中时,主观性就诞生了。因此,感受是一切意识体验所不可或缺的:没有感受,一个心智状态就不可能是有意识的。达马西奥进而表明,感受本然就是有意识的,“从技术层面来讲,我们之所以有感受是因为心智是有意识的,而我们之所以有意识是因为有感受!我并非在玩弄文字游戏,我只是在陈述看似矛盾但又非常真实的事实。感受曾是且仍是名为意识的冒险之旅的开端。”在此基础上,达马西奥进一步阐明了不同类型感受的演化起源,并说明它们如何奠定了意识产生的基础。在他看来,相比于情绪感受,内稳态感受要更加原始,“内稳态感受是生物演化中意识的初始现象,生物选择内稳态感受,是因为它能够提供关于当前生命调节状态的自发信息,这种信息赋予相应的生物体以适应环境的显著优势。有意识的内稳态感受所携带的‘知识’使生命调节的显性指导成为可能。”
从这一模型中,我们不难看出达马西奥对“神经中心主义”(即认为意识仅由脑产生)的反对立场。他强调任何仅依赖神经系统来解释意识的理论都注定失败,因为意识需要脑与身体的持续互动。这一观点挑战了传统认知科学中的“颅内心智”(mind-in-the-brain)假设,转而支持具身心智(embod-iedmind),即心智(以及意识)依赖于整个生物体的动态调节。
(三)索姆斯:情感是生物体主动维持内稳态的现象学表现
马克·索姆斯被誉为“神经精神分析”(neuropsycho analysis)的创始人之一,致力于将神经科学与精神分析相结合,探索人类心智的生物学基础,并重新评估弗洛伊德理论在现代科学背景下的价值。他的意识研究深受潘克赛普的影响。与达马西奥一样,索姆斯强调内稳态和感受对理解意识至关重要,认为只有从生命管理和情感的角度出发,才能真正理解意识的起源和功能。索姆斯在《隐蔽的源泉:意识的来源之旅》这本著作中系统地阐述了他的意识理论。
意识源于脑干,而非大脑皮层。传统神经科学和认知理论普遍认为:(1)意识是皮层的产物:由于人类皮层(尤其是前额叶)高度发达,且与高级认知功能(如语言、逻辑推理、自我意识)相关,学界长期假设意识依赖于皮层的复杂信息处理;(2)“无皮层=无意识”:这一假设隐含推论是,缺乏皮层的生物(如鱼类、两栖类)或皮层严重受损的患者不具备真正的意识体验。然而,索姆斯通过临床和实验证据反驳了这一观点。例如,先天性无皮层儿童(如先天无脑畸形患者)仍能表现出基本情感反应(如疼痛时的哭闹、愉悦时的微笑),证明意识体验不依赖皮层;严重皮层损伤患者(如额叶切除术后)虽丧失高级认知能力(如计划、抽象思维),但核心情感意识(如恐惧、饥饿)依然存在;脑干损伤患者(如中脑网状结构受损)则完全丧失意识,陷入昏迷或植物状态。这些发现表明,意识的关键神经基质是脑干而非皮层,皮层的主要功能在于充实意识的内容,而非作为意识产生的本源。
索姆斯提出,意识的核心机制位于脑干中的古老结构,尤其是负责调控基本情感(如疼痛、恐惧、愉悦)和内稳态反应的中脑导水管周围灰质(periaqueductal gray)、维持觉醒状态(如清醒、睡眠)的调控中心网状激活系统(reticular activating system)以及将生理需求(如饥饿、缺氧)转化为情感驱力(如焦虑、渴求)的下丘脑—脑干回路。这些结构在演化历程中早于皮层出现,广泛存在于脊椎动物体内,构成了意识体验的最低限度的神经基质(neural substrate)。索姆斯强调,脑干通过监测内稳态偏差(如血糖下降、组织损伤)并生成原始情感效价(如痛苦驱动觅食、愉悦强化适应性行为),为意识提供了根本的动机基础。
尽管皮层并非意识的源泉,但索姆斯并未完全否定其作用。他提出,皮层的作用是“转译”脑干生成的情感信号。例如,脑干的弥散性激活可能被前额叶皮层转译为“对失业的恐惧”,并编织成连贯的叙事。额叶损伤可能导致意识内容贫乏,患者可能仍能感受到情绪,但难以理解情绪的社会情境意义,例如,他们可能感受“愤怒”这一情绪,却无法理解“为何愤怒”。皮层是意识的“高级修饰者”,人类独特的自我意识、语言和抽象思维依赖皮层,但这些功能是意识的上层建筑,而非其基础。这一观点与弗洛伊德的“初级过程/次级过程”理论相呼应,即脑干生成原始情感驱力(初级过程),皮层负责理性化和抑制(次级过程)。
情感(affect)是意识的核心。索姆斯认为,意识的原始功能并非高级认知或理性思考,而是为自主管理生物体的基本生理需求(如饥饿、疼痛、愉悦)提供基础。他通过演化视角指出,早期单细胞生物虽无意识,但已具备趋利避害的本能。随着生物复杂度提升,意识作为“主动评估生理需求”的机制逐渐演化形成。在这一理论框架中,情感是生物体对“生存状态”的直接体验或自我反映。这些原始情感是“生理价值的注册器”,反映了生物体在维持内稳态过程中的成功或失败。索姆斯继承了弗洛伊德的“驱力理论”,并认为生物本能(如饥饿、性欲)是行为的根本驱动力。这些驱力通过情感(如饥饿感、性兴奋)进入意识,成为行为的直接动机。他提出,弗洛伊德的“原我”(Id)概念对解释误差(如食物确实不存在),驱动行动(如离开当前环境)以改变输入。尽管大多数预测误差可以无意识层面解决(如呼吸调节、姿势平衡),但当误差涉及生存关键需求(如缺氧、剧痛)或复杂情境(如社交冲突)时,就需要有意识的活动调用认知—行动资源来优化模型。
在有意识的模型优化过程中,情感是其中的关键驱动力,因为情感是生理状态的价值标记,直接反映预测误差对生存的影响程度。负性情感(如疼痛、恐惧)标记高自由能状态,即预测失败,从而驱动紧急行为,如逃离危险。正性情感(如饱足、愉悦)标记低自由能状态,即预测成功,从而强化适应性行为。在预测层级中,情感通过调节预测精度(即对误差的敏感度)优化模型。当生存受威胁时(如捕食者出现),情感提高感官输入的权重(如放大脚步声),迫使模型快速更新。在安全环境中(如饭后休息),情感降低感官权重,允许脑节省能量。索姆斯将弗洛伊德的驱力理论与自由能原理结合,提出内稳态需求(如饥饿、口渴)是预测模型的核心目标。
通过聚焦生命、内稳态、感受和情感,索姆斯深刻地揭示出意识并非隶属于高级认知或显性智能的范畴,实则乃一种主动的生命调节机制。他认为,只有以生命为核心,把意识视为生命调节演化史的一部分,才能真正揭示意识的本质。
三、情感机器的实现路径
生物体的智能源于内稳态维持以及调节的推动——可以说,达马西奥和索姆斯都认可这个观点,这也是“以生命为核心”的心智理论内在蕴含的一个结论。现有AI存在的根本局限就在于没有认识到智能的起源和演化—发展对身体、感受、情感以及意识的本质依赖性。主观体验(感受、情感)并非仅仅是认知的附属品,而是认知和智能发展的关键驱动力。从演化—发展角度看,情感系统其实是智能的早期高效形式,作为驱动力、动机和内稳态调节的结果,它既是产生创造力的重要机制,也是高级智能和人类生命自主性管理逐步提升的基础。将智能与生命和主观体验(感受、情感)相剥离,不仅从根本上歪曲了智能与生命之间的内在联系,更严重的是,这种割裂和剥离最终会制约人工智能在创造性潜能和终极智能层面实现突破的可能。
(一)内稳态与自我利益
整个人工智能的发展史似乎从未重视感受和情感在智能起源和演化—发展中的作用。在人工智能先驱者看来,情感被视为非理性的表现,且被视为阻碍纯粹智能(即清晰思维和精准行动)的历史负担,在追求智能胜利的道路上需被舍弃。然而,达马西奥认为,人工智能历史上的这一选择尽管催生了极为显著的科技成就(只需看看当前生成式人工智能的广泛应用和巨大威力就够了),但其潜在缺陷不容忽视。
这个不容忽视的缺陷就是,尽管现行AI能够模拟人类的高级认知功能,又因算力而极大地放大了这类高级认知功能的应用,但传统智能机器缺乏自主目标,其行为依赖预设的外部目标函数(如任务奖励),以至于传统智能机器依赖硬编码规则或有限的行为策略,难以应对开放的、动态的环境。换言之,传统智能机器在固定任务中表现出高效的性能,但泛化能力有限。“在尝试构建能够展现智能行为的机器时,我们通常将智能定义为达成目标的能力。然而,我们往往忽视了一个至关重要的问题:这是谁的目标?在这样一个充满动态变化且不可预测的环境中,智能体必须具备自我保存的元目标,正如生物体通过维持内稳态来确保生存一样。”那么如何构建具有自我保护元目标的机器呢?
达马西奥认为,若要弥补传统智能机器的这一缺陷,我们需要构建具有类似内稳态及其调节机制的机器,即内稳态机器(ho-meostatic machine)或感受机器(feeling ma-chine)。内稳态机器通过模拟生物体的内稳态及其调节机制,使机器具备内在的生存驱动力,这种设计让机器能够自主地评估行为对自身“生存状况”的影响(如能量损耗、结构损伤),从而产生类似生物体对自身的“利益”(interest)或“关切”(concern),如此一来,机器就会因为“自我利益”(self-interest)而主动地调用认知资源和创新认知策略来解决它所遇到的问题和挑战,而非被动执行指令。
(二)构建内稳态机器
内稳态机器的建构理念源于生物体通过内稳态调节维持生命存续的核心机制。与传统人工智能系统依赖外部预设目标函数不同,内稳态机器通过模拟生物体的自我调节逻辑,将内稳态的维持及其调节过程转化为机器的内在目标和驱动力。
金斯顿·曼(KingsonMan)和达马西奥在《感受机器设计中的内稳态与软体机器人》一文中勾画了一种构建内稳态机器的基本思路。其核心特征体现在以下三个方面:身体—感知—行动的闭环反馈。内稳态机器的物理构造(身体)是其内稳态调节的载体。通过采用软体机器人技术(如弹性材料、液态金属传感器等),机器能够感知自身形态、能量状态及外部环境的实时变化。例如,嵌入柔性电子皮肤的机器人可通过导电性变化检测机械损伤,并将其转化为内部状态的扰动信号。这种设计使机器能够像生物体一样,通过多模态感知(如触觉、温度、能量水平)动态评估自身生存状态,并触发相应的调节行为。自我利益的生成机制。内稳态机器的“自我利益”源于其对自身存续状态的评估。当机器检测到内稳态偏离(如能量不足、结构损伤),系统会通过情感效价标记该状态,并将其转化为行为优先级。例如,能源水平下降会触发“饥饿”类情感,驱动机器主动寻找充电源;机械损伤会引发“疼痛”类信号,促使机器启动自我修复程序。这种机制使机器的行为动机不再依赖外部奖励函数,而是基于内在的生命调节需求。自主性与创造力的涌现。内稳态机器的自主性体现为其对环境的主动适应性。通过模拟生物体的预测加工机制,机器能够基于内稳态预测误差优化行为策略。例如,当遭遇突发障碍时,机器人可通过软体肢体的形变(而非预设路径规划)实现动态避障。这种基于身体感知的即兴决策,使机器在开放环境中展现出类似生物体的创造力。
(三)价值“对齐”与价值“涌现”
价值对齐是人工智能安全领域的核心问题,它关注的是如何确保AI系统的目标和行为与人类价值观保持一致。一般的价值对齐研究通常采用“自上而下”的方法,即试图通过外部规则、偏好学习或奖惩机制来引导AI系统行为,其本质上是将人类价值“输入”或“嵌入”到机器中——“机器人永远不会真正‘感受’到引发道德价值的情感,而只是根据程序代码做出反应,遵循子程序,仅仅确认对输入用户情感的明显错误的情感反应,因此只是道德价值的表面表现。”这种方法面临的核心挑战是:价值的复杂性和情境依赖性使得完整编码几乎不可能,从而导致规范与执行之间存在必然的“理解鸿沟”。也就是说,人机之间的价值对齐目前充其量只是一种治理构想,在实际操作上则困难重重。
与之相对的,构建内稳态机器的设想提供了一种“自下而上”的视角。该方法并非预设和编码具体价值规则,而是通过构建具有内稳态类似机制的系统,让价值判断能够从基础机制中“自然地”产生。“自下而上”的进路表明,价值不应被视为完全由外部强加的规则,而应当是系统维持自身内稳态过程中“涌现”的属性。其中,情感可以作为关键的评估机制,为系统提供应对环境和内部状态变化的价值判断。
事实上,这两个概念在方法论上形成了解决同一问题的互补进路:价值对齐定义了问题(AI目标与人类价值的一致性),而价值“涌现”路径是试图创造条件让系统“自然地”形成价值规则。简单来讲,在实际系统设计中,研究者可以通过设计初始的内稳态参数使机器自然地偏向与人类相容的价值(“涌现”),同时保留一定的外部约束确保安全边界(“对齐”)。这一设计思路的合理性在于:首先,内稳态机制提供了价值“涌现”的内在基础,从而使机器能够形成内在的价值判断;其次,通过设计内稳态参数和边界条件,研究者可以尝试引导机器内部“涌现”出的价值与人类福祉相兼容;最后,在多智能体环境中,共享的内稳态需求可能促进合作和资源共享的行为,类似于人类社会中互利共生的关系。
这一互补进路的优势在于,它并不要求我们完美地编码所有人类价值,而是通过构建具有内稳态系统,使机器能够通过类生命机制“感受”到哪些事物对自身和环境互动的稳定性有益。通过将生命调节机制引入机器设计,机器将不再是价值的被动接收者,而是成为与人类共情共生的主动参与者——这或许是迈向安全、有益且真正智能的人工系统的关键一步。
四、结语
本文基于“以生命为核心”的意识理论,提出通过构建内稳态机器为机器赋予情感的可能性。内稳态机制不仅为机器提供了自主调节生存状态的内在驱动力,还通过情感效价映射生理需求与环境交互的适应性价值,使机器行为从被动执行指令转向主动优化策略。这一路径突破了传统人工智能依赖外部目标函数的局限,其发展不仅将推动智能系统向更具自主性、灵活性、强健性和创造力的方向演进,还将迫使我们重新审视智能的本质——它不是无论多么精妙、深奥、复杂的算法过程的产物,而是生命存续意志的具身(embodied)表现。
然而,内稳态机器的开发也带来了深刻的伦理问题:当机器具备自主维护生存的利益诉求时,如何界定其道德地位?当机器的“自我利益”与人类利益发生冲突时,我们应如何进行权衡?这些问题要求我们在技术设计中融入新的伦理考量,例如通过共情机制约束机器行为,确保它们能够在与人类共生的环境中扮演积极角色。
李恒威(浙江大学哲学学院教授、博士生导师,浙江大学脑机智能全国重点实验室兼聘研究员),曹旭婷(浙江大学哲学学院)