当前位置: 首页 » 资讯 » 新科技 » 正文

机器情感与AI陪伴的人文审度⑥|邱德钧、李玮农:超越记忆——情感计算中遗忘的必要性和实现

IP属地 中国·北京 编辑:柳晴雪 澎湃新闻 时间:2025-07-17 12:28:58

2024年被称为“人形机器人元年”。很多人预测,随着机器人大规模出现在普通人的家居生活环境中,人与机器人之间进行情感交流将成为未来智能社会的常态。所谓机器情感、AI陪伴的实质是什么,对人机交互、人机关系产生何种影响?比如说,从文化视角和性别视角,应该如何看待人机情感关系呢?人与机器的情感交流,将会产生何种社会冲击,导致何种技术风险和技术伦理问题,又应该如何应对?类似问题,已经引发诸多热议。本次笔谈聚焦“机器情感与AI陪伴的人文审度”,从哲学、马克思主义理论、文学和人工智能等进行跨学科研究,抛砖引玉,以期推动该领域研究的进一步发展。

在《建构主义视域下的机器情感》中,刘永谋和白英慧界定机器情感的概念,并从情感智能、人机情感和人机互动三个方面剖析机器情感的建构性,主张机器情感发展的有限主义进路。在《机器如何可能有情感?——基于“以生命为核心”的意识理论的探讨》中,李恒威和曹旭婷指出,基于“以生命为核心”的意识理论,通过模拟生物体的内稳态调节机制,可以为机器赋予情感能力,从而使其具备自主适应性和内在驱动力,为通用人工智能的发展提供新思路。在《人机情感交互的伦理反思及其规约路径——以AI复活技术为例》中,张卫和张陈杰认为AI复活技术使得人机情感交互出现了新的形式,但是由于情感不对称性,会形成情感依赖、情感异化、身份欺骗、认同危机以及情感资本化等伦理僭越风险,需要从制度规约、技术设计和文化调节等视角,寻找AI复活技术发展的向善之道。在《情感人工智能需要“身体”吗?》中,吴静和王隽雅认为当情感AI成为人类寻求情感互动的对象,情感的具身性特征与人类情感交互的复杂规则共同提出了对情感AI拟真性的高需求,这就使得情感AI的“身体”设计需要面临多重认知、伦理和法规上的拷问。在《非人之恋文化史视域下的当代人机恋:渊源、特点与风险》一文中,程林与张玥指出,作为非人之恋4.0阶段,当代人机恋的核心特征是在社会现实青年群体中的日常化和深度化,并具有趣缘性、生成性与游戏性等特点,但其情感和伦理风险也不容忽视。在《超越记忆—情感计算中遗忘的必要性和实现》一文中,邱德钧和李玮农批判当前情感计算中过度理想化的技术假设,提出引入自然衰减与主动选择性遗忘的现象学启发神经计算模型,强调遗忘机制在构建真实、伦理、适应性情感AI中的关键作用。(专题特邀主持:刘永谋)

本系列文章原刊《科学·经济·社会》2025年第3期,澎湃新闻经授权转载。

当前情感计算领域哲学讨论中普遍存在着理想化技术假设,批判地考察其对“无限技术可行性”的过度肯定与对“遗忘机制”的系统性忽视,指出遗忘并非情感计算的缺陷,而是实现更具真实性、伦理性和社会适应性的人工智能情感系统的关键要素。我们构建了一个由现象学启发的类人遗忘神经计算模型,该模型整合了个体情感记忆的自然衰退以及主动选择性遗忘机制等,详细阐述了模型的理论基础、结构组成、数学建模与计算方法,并进一步从哲学层面探讨了灾难性遗忘虽然由AI 传导到情感计算领域,但实际上是可管理可控的,而非灾难的。

一、问题提出与研究前景

(一)情感计算的哲学讨论中理想化假设的困境

随着大语言模型在公众应用中的场景爆发,情感计算(affective computing)也受到关注。情感是人类自豪的智能表现,但为了更广泛的人机交互,需要把主观抽象的情感以计算手段表达出来,这与主张情感可量化不同,是为了更广泛的人机交互的需求,以计算模拟表达情感。情感计算作为人工智能研究的重要前沿领域,自 1997 年罗莎琳德·皮卡德(Rosalind Picard)出版《情感计算》(Affective Computing)一书并首次提出“情感计算”这一概念以来,始终致力于使计算机能够识别、理解、表达和调节人类情感。在人工智能盛行的当下,由于对技术细节的不完全把握,一些讨论往往建立在一个未经严格反思的、过于理想化的技术假设之上,即认为人工智能在技术上已经或即将完全 实现对人类情感的准确模拟和复制。这一假设一方面将技术的无限可实现性作为毫不动摇的前提,认为技术无论怎样都“终将”实现,并基于此探讨伦理与哲学议题,过早把遥远的不确定性的未来难题当作当下真实的难题,忽略了未来的变化;另一方面还表现为将情感简单地视为一系列可编码、可识别的信号,例如面部表情识别、语音情感识别等,忽视了人类真实情感体验的复杂性、具身性和情境记忆性,使得对于情感计算这一技术想象得过于乐观。更为重要的是,现在的讨论往往忽视了情感计算的目标,即“始终致力于使计算机能够识别、理解、表达和调节人类情感”,对这一目标的忽视直接导致了借现象学套用概念而对情感计算这一技术本质产生误解。基于技术理想化的假设,哲学界和伦理学界提出了一系列看似前瞻、却与现实技术进步明显脱节的问题,如“人工智能是否应享有情感权利”“人工智能的情感奴役问题”等。这种讨论在理论上虽然具有一定的启发性,但由于忽视了情感计算在当前技术现实中的诸多障碍,往往造成了“ 超前”甚至 “脱离实际”的伦理空转。这种空转不仅使得哲学与伦理讨论失去了对当前技术发展的现实指导意义,也容易误导实际的技术研究方向。

情感计算领域当前依旧面临诸多现实的技术挑战。首先,情感识别与生成技术严重依赖于数据集的规模与质量,基于情感的私密性和主观性,当前情感计算的数据集获取难度极大,高质量的数据集更是少之又少,这也导致了目前仍然普遍存在的数据偏差、情感泛化困难和上下文理解不足等问题。其次,情感表达在人工智能系统中常常显得肤浅或机械化,难以真正模拟人类情感体验的丰富性和深刻性。现有情感计算系统往往基于静态的情感数据且以此判定情感状态“长期有效”,忽略了人类情感本身具备动态重构和发展的特征。当然,这一问题与实时情感计算所面临的技术难点息息相关。可见,目前情感计算所面临的真实的技术发展路径并非简单的线性进步,其道路上充满了各种现实中难以预料的技术、资源与伦理挑战。因此,必须首先认识到当前部分哲学与伦理讨论的“空中楼阁”,明确指出无限技术可行性下的完美情感AI 这一前提假设事实上是脱离实际的虚假假设,这种假设对于技术与哲学研究本身都将可能产生严重的误导。

(二)情感人工智能的关键而被忽视的维度——遗忘机制

陶建华等于2005 年发表的综述文章《情感计算:综述》对情感计算的发展进行了全面的回顾,重点关注情感语音处理、面部表情分析与合成、肢体动作分析、多通道信息处理以及情感理解与生成,讨论语音和面部表情中的时间动态特征,例如语音的韵律特征(音高、语速等)和面部表情的变化。这篇综述主要关注如何识别这些时间模式以判断情感状态,而没有探讨情感信息在更长时间范围内的衰减或遗忘机制。Koelstra 等在 2011 年提出的DEAP 数据集(情感分析生理信号数据库)是一个广泛使用的多模态情感分析资源库,包含了参与者观看音乐视频时的脑电图(EEG)和外周生理信号。该数据集记录了参与者在观看视频过程中情感随时间变化的生理反应,为研究情感的动态特性提供了宝贵的数据。利用 DEAP 数据集构建的情感计算模型通常侧重基于生理信号实时分类情感状态,而很少关注模型内部如何处理或遗忘过去的情感信息。Calvo等回顾了情感计算领域的情感理论和检测方法,涵盖了生理信号、面部表情、语音、文本和肢体语言等多种模态。该综述讨论了不同情感检测方法的优势和局限性,但并未涉及模型中遗忘机制的相关内容。Soley- mani 等在 2012 年提出MAHNOB-HCI 数据集(情感识别和隐式标注多模态数据库),同样是一个重要的多模态情感数据库,包含了面部视频、音频、眼动追踪和生理信号等数据。研究人员可以利用该数据集进行情感识别和隐式标注的研究,如基于面部表情预测用户对标签正确性的反应。虽然该数据集记录了情感表达的时间序列数据,但利用这些数据构建的模型通常着重于识别特定时间点或时间段的情感状态,而缺乏对情感信息长期记忆和遗忘的建模。Alarcão 等对2009 年至2016 年间基于脑电信号的情感识别研究进行了全面的总结,探讨了不同研究中使用的被试、特征提取方法和分类器。虽然脑电信号本身具有时间序列的特性,并且一些研究也采用了时频分析等方法提取特征,但该综述并未提及模型中是否存在遗忘机制。 Eyben 等在 2009 年开发的 Ope- nEAR(慕尼黑开源情感和情感识别工具包)是一个用于语音情感识别的重要工具,它能够实时提取语音特征并进行情感分类。 OpenEAR 的设计侧重于高效的实时处理,而没有涉及情感信息的长期管理或遗忘机制。Sano 等在 2013 年的研究展示了情感计算在压力检测方面的应用,利用可穿戴传感器和手机数据监测个体的生理和行为信号,以识别压力水平。虽然该研究涉及时间序列数据的分析,但其重点在于识别当前的压力状态,而非模型如何处理或遗忘过去的压力事件。总的来看,当前情感计算领域的主流研究工作主要关注如何准确地识别、表达和交互情感,对于情感信息的时间维度处理,更多的是着眼于如何利用时间序列数据进行情感状态的判断和预测,而鲜有研究关注模型内部是否以及如何实现情感信息的遗忘。

另一方面,如果将视野放到与情感计算相关的人工智能领域,近年来,随着深度学习的发展 ,记 忆增强神经网 络(memory- augmented neural networks)被广泛研究,用以突破传统神经网络在长期依赖和外部知识利用方面的局限。Khosla 等系统梳理了该领域的核心方案,包括 LSTM 类循环网络、Transformer 及其注意力机制、联想记忆网 络( 如 Hopfield 网 络)、神经图灵机(NTM),以及基于外部知识检索的架构(如 REALM,RETRO 等)。这些方案通过不同方式扩展神经网络的记忆容量,实现了信息的主动保存与高效检索,在自然语言处理等任务上表现出色。上述模型也各自面临着诸多不足,循环神经网络虽在短期依赖上有所突破,但难以维持高度复杂或长期的信息;Transformer 等自注意力结构虽然能建模长距离关系,但在面对超长序列时计算与存储开销巨大;而外部记忆机制则极度依赖检索器性能,且“ 查找”与“ 使用”往往存在割裂,外部知识库的维护与有效利用亦是难点。这些方法多重视如何提升信息的获取与保存,却鲜有关注遗忘机制的引入与调控。正如书写可以加强人类外部信息保存能力,却可能削弱内在记忆力,现有的记忆增强神经网络方案更多提升了模型的“外部记忆”能力,而对于“自身记忆”能力的平衡与遗忘机制的合理引入仍显不足。未来在增强神经网络记忆能力的同时,如何合理建模自动遗忘与选择性保留,是值得进一步探索的重要方向。在情感计算模型中忽略遗忘机制可能会导致一系列技术问题。

首先,一方面,忽略遗忘机制可能导致系统对过去的情感事件持续敏感,难以适应新的情感状态或情境,即使这些事件已经过去很久,并且当前情境已经发生变化。这种持续的敏感性会导致系统在处理当前情感信息时产生偏差,当用户的情感状态发生转变时,系统可能仍然会基于过去的经验做出反应,而无法及时调整到新的情感状态,使得最终无法准确地反映用户当前的真实情感状态。例如,一个曾经检测到用户悲伤情绪的系统,可能会在用户情绪已经好转后仍然倾向于将其解读为带有负面色彩;一个习惯于在用户愤怒时提供安慰的系统,可能在用户转为兴奋时仍然提供安慰,从而显得不合时宜。

另一方面,在长期交互中,忽略遗忘机制又可能反过来导致系统产生不一致性。随着时间的推移,系统积累了大量的历史情感数据。如果这些数据没有被适当地筛选、遗忘或赋予不同的权重,那么系统在不同时间点对同一类型的情感刺激可能会产生不一致的反应。例如,在交互初期对用户的沮丧情绪表示理解的系统,在长期交互后可能会因为积累了过多的类似事件而降低敏感性。

需要认识到,情感并非静态的数据表现,而是随着时间和情境不断变化重构的动态过程。遗忘机制的存在能够允许人工智能适时地舍弃不再相关或过时的情感数据,从而实现更真实化地动态情感计算与发展,避免陷入情感认知的僵化和过拟合。

其次,从系统运行的角度考虑,长期存储和处理所有过去的情感数据可能会导致内存过载和计算效率低下,在计算资源有限的现实情境中,情感数据的无限累积会造成存储与计算的负担,引发“维度灾难”。对于需要实时响应的情感计算应用来说,这是一个不可忽视的问题。情感的“衰减”是人类情感体验的一个自然特征,当前的情感计算模型往往缺乏对这种衰减过程的显式建模。

最后,从应用落地的角度来看,在用户互动方面,如果忽略遗忘机制,僵化和过拟合的情感机器将会降低用户的体验和信任感。一个在用户表达过悲伤后一直对其过度关心的虚拟助手,可能会让用户感到不适。

这些局限性表明,为了使情感计算应用更加智能、自然和有效,引入遗忘机制是至关重要的。目前相关的论题对遗忘机制缺乏系统性的研究与论述,这一空白将严重影响技术的推进与人文的讨论。本研究旨在填补这一理论与技术空缺,从哲学反思和数学建模等维度出发,深入研究人工智能情感计算中的遗忘机制,开辟情感计算研究新的视域,推动人工智能技术朝向更贴合人性、更真实有效的方向发展。

二、人工智能情感计算中遗忘机制的哲学基础与理论建构

(一)遗忘机制的哲学基础

从哲学上看,人类情感记忆系统本身就体现了记忆与遗忘之间的辩证关系,个体的记忆从未被完整地保存,总是伴随着主动与被动的遗忘过程。个体遗忘不仅是生物学的必然过程,更是心理与社会适应的必要条件。事实上,如果个体无法遗忘过去的痛苦经历,其心理健康与人格发展必然会受到严重损害。因而,遗忘并非一种缺陷或消极的现象,而是人类个体得以持续健康发展和自我重塑的基础性能力。柏拉图在他的“ 回忆说”中,将学习视为对灵魂在出生前已知的知识的回忆。在《美诺篇》中,苏格拉底通过引导一个奴隶男孩回忆几何知识,来论证知识是回忆而非学习。柏拉图认为,灵魂是不朽的,虽然它曾经见识过“ 理式”的世界,但在降生时遗忘了这些知识。学习的过程就是通过感官经验和理性思考,重新唤醒这些沉睡的记忆。尽管柏拉图强调回忆,但他并非支持为了避免遗忘而不择手段。在《斐德若篇》中,他借苏格拉底之口批评文字的发明,认为文字会使人们依赖外部符号而疏于练习记忆力,从而导致遗忘。“他们就信任书文,只凭外在的符号再认,并非凭内在的脑力回忆。所以你所发明的这剂药,只能医再认,不能医记忆。”柏拉图在此暗示,过度依赖外部记忆存储可能会削弱我们自身记忆的能力,同时也传递了一个想法,为了避免遗忘而采取的一些强硬的辅助手段可能错误地偏离了记忆的本质,最终可能导致“ 记忆”能力的丧失而非增强。尼采认为,遗忘是生命和健康的必要条件。在《道德的谱系》中,他将遗忘描述为一种“主动的、最严格意义上的积极的阻力”,是体魄强健的表现形式。尼采指出,动物活在当下,不为昨日或明日忧虑,这正是它们幸福的原因。人类却 因记忆的重负而难以获得这种纯粹的快乐。 “他无法学会忘记,总是留恋过去;不管他跑得多远,跑得多快,那锁链总跟着他。”尼采 强调,为了行动和创造,我们需要有选择地遗忘过去,摆脱不必要的记忆束缚。“但不管是最微小的幸福还是最强烈的幸福,其中总有一样东西是让它得以成为幸福的:那就是遗忘力,或者用更学术的话来说,在整个过程中感觉到“非历史”的能力。”他认为,无法遗忘的人将被过去所吞噬,失去前进的动力,甚至无法相信自己的存在。因此,“主动遗忘”并非简单的被动遗忘,而是一种有意识地清除那些阻碍我们前进的记忆,从而拥抱当下和未来的能力。哲学思想为在情感计算中引入遗忘机制提供了深刻的启示。尼采的 “主动遗忘”提醒我们,情感计算系统不应成为过去情感的简单记录器,而应具备选择性遗忘的能力,以适应用户不断变化的情感状态。柏拉图关于过度依赖外部记忆可能导致自身记忆力衰退的观点,也警示我们在设计情感计算系统时,一方面应认识到不应为了防止人工智能灾难性遗忘而讳疾忌医,通过施加错误的辅助手段导致可能更加严重的记忆能力的下降,忽略遗忘机制的重要性和记忆的本质;另一方面从用户角度来说,设计系统还应努力避免让用户过度依赖系统的情感记忆功能,从而削弱用户自身的情感感知和调节能力。

为了更深入地理解个体遗忘机制,我们需要借助现象学传统的哲学分析框架。胡塞尔在其《内时间意识现象学》中,详细论述了人类意识体验的时间结构。他提出,意识体验具有“原印象”“滞留”“前摄”的三重结构。其中“,滞留”概念尤其体现了意识体验随时间推移而逐渐淡化的特征。在他看来,体验的淡化并非意识或记忆能力的缺陷,而是意识体验存在方式的本质属性。如果意识体验没有随时间消退的机制,那么意识便无法形成稳定、有序而连贯的时间序列。事实上“滞留”提供了一种解释人类个体情感遗忘机制的哲学模型。人类的情感体验并非永久地被完整保留在意识中,而是持续地、逐渐地褪去强烈的色彩,变得模糊、淡化并最终被其他新的情感体验所取代。这种渐进的遗忘过程赋予情感体验连续性和真实性,避免了情感体验之间的混乱和记忆的过载。现象学的视角帮助我们纠正当前人工智能情感计算中过于静态和持久存储情感记忆的理论偏差,为建构更加类人的情感计算模型提供了充分的哲学依据和指导方向,这意味着我们必须在计算模型中真实地体现出情感记忆的自然淡化与连续性特征。

此外,遗忘机制并不仅限于个体层面的自然、被动过程。尼采的“主动遗忘”概念揭示了遗忘并非只是意识能力上的弱点或消极现象,更是一种主动而积极的生命策略。通过主动地遗忘,个体与社会将摆脱沉重的历史负担,获得重新塑造未来的自由与力量。从个体伦理角度看,主动遗忘帮助个体抛弃负面的、自我毁灭的情感记忆,创造心理与精神的自由空间,体现了一种超越历史记忆负担的生命力量,显著地促进了个体自我的持续更新与人格发展。而当我们将这一思想扩展到集体遗忘时,我们可以看到,社会群体常常通过主动遗忘历史中负面的或不再适用的观念、记忆、情感,以促进社会的进步、认同和文化的稳定性。例如,民族或国家通过选择性地淡化或遗忘过去的负面历史,以构建新的社会认同与伦理共识。人工智能情感计算同样需要模拟这种主动选择性的遗忘机制,使其不仅能够被动地处理情感记忆衰减,更能在伦理需求与社会情感互动过程中,主动选择和决定遗忘哪些情感数据。这种积极的遗忘能力,赋予了情感计算模型以更高层次的伦理敏感性与社会互动适应性,使其在实际的人机交互或多智能体互动场景中更具真实性和适应性。在个体层面,遗忘机制保障了情感体验的真实性与连续性,在群体层面,遗忘机制保障了社会互动的适应性与伦理稳定性。

保罗·利科(Paul Ricœu)在其《记忆,历史,遗忘》中认为,社会凝聚力并非建立在对过去事件的完全一致的记忆之上,遗忘在其中也扮演着重要的角色。在面对社会创伤和冲突之后,适度的遗忘可以帮助社会成员放下过去的仇恨和对立,从而实现和解与重建。他关注历史与创伤之间的关系,特别是被遗忘的历史,在他看来,遗忘不是记忆的否定,他超越了这种简单的二元对立,将遗忘呈现为一个多方面且积极的过程,具有自身的动态和模式。作为与记忆、历史同等地位的角色,利科将遗忘放置于书本的标题中。他举了博尔赫斯(Luis Borges)的寓言为例,表达了这一观点:“遗忘因此并不是在所有情况下都是记忆的敌人,并且为了摸索 着寻找公正尺度以保持记忆和遗忘的平衡,它们应该进行协商?……一个没有任何遗忘的记忆,是这种我们在整个历史条件的诠释学范围内与之作斗争的彻底反思的终极 幻想、终极形态?”事实上,遗忘是记忆可能性的条件,因为它允许选择和优先化记忆。如果没有遗忘,我们是不可能同时记住所有事物的,也正是因为遗忘的存在,使得某些记忆能够浮出水面。利科对“记忆过剩”和 “遗忘过剩”之间动态张力的关注也凸显了两者关系的复杂性。他认为,记忆和遗忘之间的平衡对于个人和集体的健康至关重要。此外,利科也强调了记忆的伦理责任,特别是在涉及历史正义和受害者纪念方面,这表明社会遗忘并非没有界限。社会遗忘在社会身份的构建和维护中也发挥着作用。集体记忆是社会群体身份认同的重要组成部分,但并非所有过去都被同等程度地记住。社会往往会选择性地强调某些历史事件和叙事,而忽略或淡化其他一些,这有助于形成共同的价值观和文化认同感。这种选择性的“遗忘”并非总是负面的,它可以帮助社会在不断变化的环境中保持其核心特征和凝聚力。例如,一个社会可能选择记住其团结抵抗外来侵略的光辉历史,而淡化内部冲突和分裂的时期,以增强民族自豪感和认同感。在经历了严重的社会冲突或政治动荡之后,遗忘往往成为社会和解的关键因素。尽管正义和真相是重要的,但过度强调过去的伤痛和仇恨可能会阻碍社会成员之间的信任重建和未来合作。适度的社会遗忘,即不强迫遗忘,但允许时间抚平伤痕,并鼓励社会成员将注意力转向共同的未来,可以为社会和解创造更有利的环境。在某些情况下,“选择性遗忘”可以被视为社会疗愈的一种策略。这也是为什么利科在书中还提到了“愉快的记忆/遗忘”,历史写作不可避免地存在空白、遗漏和选择,选择某些叙事意味着遮蔽另一些叙事。社会有时需要从痛苦的过去中解放出来,以便构建更加积极的未来。最后还需要注意的是,利科在书中还论述了一个极具启发的内容,也就是“深度遗忘中的痕迹问题”,通过对遗忘与痕迹的消失与持存的讨论,暗示了被遗忘的记忆不一定会被抹除,而是以潜在的形式存在。这一概念挑战了完全抹除的观念,表明遗忘可能只是记忆的一种未被感知的持续存在。

从尼采对社会群体健康的强调,到利科关于遗忘与社会凝聚力的辩证思考,再到社会遗忘在社会身份构建和社会和解中的作用,哲学为我们提供了丰富的视角来理解遗忘在社会层面的积极意义。当然,社会遗忘并非没有风险,它可能导致对历史教训的忽视或对不公正的遗忘。因此,社会需要在记忆与遗忘之间取得微妙的平衡,既要铭记重要的历史经验,也要适时地放下过去的包袱,以便更好地应对当下的挑战和开创未来。在人工智能情感计算领域,理解社会遗忘的哲学基础,或许能为我们设计更具社会意识和伦理责任感的智能系统提供新的启示。这些哲学基础为我们构建统一的遗忘机制计算模型提供了深入的理论支撑与清晰的建模方向。

(二)类人遗忘神经计算模型(PHFNM)的结构与理论定义

在前文分析中,我们深入讨论了个体遗忘与社会集体遗忘在人工智能情感计算中的重要性,指出了情感计算中遗忘机制的本质不仅在于情感数据的自然衰减,更在于通过主动的遗忘过程使个体和集体情感体验保持灵活性和适应性。胡塞尔的现象学理论强调了个体体验随时间必然发生的动态衰退过程(滞留),而尼采和利科的理论则启发了一种群体主动遗忘作为塑造未来的积极力量。因此,一个真正具有人类情感体验真实性的人工智能情感计算系统,应当同时体现个体层面的自然遗忘与群体层面的主动选择遗忘。基于上述理论基础,本研究提出了一种由现象学启发的类人遗忘神经计算模型(phenomenology-inspired human-like forgetting neural model, PHFNM),旨在为情感计算中的遗忘机制提供一个逻辑严密、理论自洽的框架。

在构建PHFNM 之前,我们参考了近期 Nature 的研究成果 ,即 Chandra 等提出的 “vector hippocampal scaffolded heteroassocia- tive memory”(Vector-HaSH)模型。该模型 通过模拟海马体在空间记忆和情节记忆中 的双重角色,提出了一种统一的神经计算框架,强调了网格细胞(grid cells)作为内部支架(scaffold)在记忆存储和序列回忆中的关键作用。Vector-HaSH 模型的创新在于将内容存储与动态纠错过程分离,利用网格细胞的低维向量更新机制实现高容量记忆存储,并通过空间支架支持情节记忆的序列化组织。其优点在于逻辑严密性和理论自洽性:模型不仅重现了海马体和内嗅皮层的多种实验现象,还为记忆宫殿技术提供了神经电路解释,展现了空间结构如何支持非空间记忆的深刻洞察。此外,该模型通过避免传统Hopfield 网络的“记忆悬崖”问题,实现了存储容量与回忆精度的平滑权衡,为记忆动态的建模提供了重要的理论基础。

Vector-HaSH 模型在一定程度上与我们研究的目标相契合,尤其是在强调记忆的动态演化和结构化支架对记忆管理的重要性方面。我们的研究同样关注记忆的动态变化(自然衰减与主动遗忘)以及如何通过结构化机制实现情感记忆的适应性管理。 Vector-HaSH 模型主要聚焦于空间记忆和情节记忆的神经机制,缺乏对情感记忆特异性及其伦理、社会维度的考量,也未涉及遗忘机制在情感计算中的主动性和适应性作用。其模型设计虽强调网格细胞的支架作用,但未充分探讨记忆的衰减与选择性遗忘如何在个体和集体层面协同运作。因此,在吸收 Vector-HaSH 模型优点的基础上,结合现象学、尼采和利科的哲学理论,构建了PHFNM模型,旨在填补情感计算中遗忘机制研究的空白,并通过三层架构实现个体与集体、被动与主动遗忘的统一建模。

PHFNM 在结构上由以下三个互为支撑的层次组成,这一设计受到了 Vector-HaSH模型中网格细胞支架、记忆存储与动态调节机制的启发,同时融入了哲学理论对遗忘的多重维度的深刻洞察。三个层次在逻辑上相互关联,共同构成一个严密自洽的体系,旨在模拟情感记忆的自然演化与社会适应性。

1. 低维情感索引与自然衰退层(Grid Cell Layer, GCL)

这一层的设计灵感来源于 Vector-HaSH模型中网格细胞作为低维支架的作用。 Chandra 等提出,网格细胞通过低维向量更新机制,将复杂的序列记忆问题转化为低维过渡学习,从而显著提升记忆容量和稳定性。在PHFNM 中,我们将这一机制扩展到情感计算领域,将情感数据编码为低维向量形式,并通过自然衰退过程模拟胡塞尔现象学所强调的意识体验随时间逐渐淡化的“滞留”特性。GCL 层通过低维索引为情感记忆提供结构化支架,确保情感数据的动态衰减符合个体体验的连续性和真实性,同时避免了高维数据直接存储带来的计算过载问题。GCL 层的存在不仅是模型的基础层,也为后续层次的记忆存储和调节提供了结构化支持。

2. 情感记忆存储与集体动态重构层(Memory Encoding and Reconstruction Layer,MERL)

这一层参考了Vector-HaSH 模型中内容存储与动态重构的功能。Chandra 等通过分离内容存储与吸引子动态,实现了高容量内容寻址记忆,并通过多模态输入支持情节记忆的序列化重构。在PHFNM 中,MERL 层负责具体情感内容的存储,并通过多智能体互动和多模态数据融合方法,动态实现记忆重构与情感协商。这一设计不仅反映了个体情感记忆的存储与回忆过程,还体现了利科哲学中集体记忆形成的社会互动与协商特征。MERL 层通过与GCL 层的低维支架交互,确保情感记忆在存储与重构过程中保持结构化特性,同时通过集体动态重构机制,反映群体记忆的现实复杂性与社会真实性。MERL 层作为中间层,连接了低维索引与高阶调节功能,构成了模型的核心内容管理模块。

3. 主动遗忘与干扰控制层(Active For- getting and Interference Regulation Layer, AFIRL)

这一层的设计灵感参考了 Vector-HaSH模型中动态纠错与稳定状态调节的机制,但进一步扩展到情感计算中的主动遗忘与伦理导向需求。Chandra 等通过网格细胞支架生成稳定固定点,避免了记忆悬崖问题 ,实 现了记忆系统的动态平衡 。 在 PHFNM 中,AFIRL 层模拟尼采哲学所揭示 的“主动遗忘”过程,通过伦理导向与情绪需求主动决定遗忘哪些情感数据,并合理处理新旧情感之间的干扰现象。这一层不仅在个体层面支持情感体验的主动调节,还在集体层面协调群体的情感互动,体现了利科关于社会遗忘在和解与认同构建中的积极作用。AFIRL 层作为顶层调节机制,与GCL 层的结构化支架和MERL 层的内容存储形成闭环,确保遗忘过程既符合个体情感的动态需求,又具备社会认知与伦理责任。

上述三层架构的逻辑严密性与自洽性体现在其理论来源与功能互补性上。首先,三层设计在一定程度上映射了 Vector-HaSH模型中网格细胞支 架(GCL)、内容存储(MERL)与动态调节(AFIRL)的核心思想,确保了模型在计算框架上的科学性与可操作性。其次,三层划分也大致分别对应了哲学理论中的个体自然遗忘(胡塞尔)、集体记忆重构(利科)与主动遗忘(尼采),实现了跨学科知识的深度融合。GCL 层为情感记忆提供低维结构化基础,MERL 层负责内容存储与社会协商,AFIRL 层则通过主动遗忘与干扰控制实现动态适应,三者共同构成一个从基础索引到内容管理再到高阶调节的完整体系,缺一不可。这种分层设计不仅模拟了情感记忆随时间变化的自然衰减、基于访问和情绪强度的稳固、受伦理和情绪影响的主动遗忘,以及新信息带来的干扰,还通过层次间的紧密耦合,确保了模型在个体与集体、被动与主动遗忘之间的平衡。

模型的核心状态包括情感记忆矩阵和稳固因子矩阵。情感记忆矩阵存储情感内容或强度,其动态变化受自然衰减、稳固因子、主动遗忘和干扰等多重因素影响;稳固因子矩阵则表示记忆的重要性和抗遗忘能力,通过访问频率与情绪强度动态更新。这一设计与Vector-HaSH 模型中存储容量与回忆精度平滑权衡的理念相似,旨在通过量化记忆的稳固性与衰减过程,模拟情感记忆的真实演化轨迹。

通过上述设计,PHFNM 不仅继承了 Vector-HaSH 模型在记忆动态建模上的逻辑严密性,还通过融入哲学理论,扩展了模型对情感遗忘机制的适用性与解释力。本模型并非面向完全实证的计算工具,而是旨在为情感计算中的遗忘机制研究提供一个理论框架,为后续实证工作指明方向。接下来的部分将对这一理论框架转化为相应数学模型的过程、定义和核心状态变量与动态更新规则进行阐述。

模型模拟个体的情感记忆随时间的变化,整合了自然衰减、基于访问和情绪强度的稳固、受伦理和情绪影响的主动遗忘。





(三)已解决和未能解决的问题

该模型模拟个体层面情感记忆的动态演化过程,整合了多种关键机制,在记忆表示上,使用高维矩阵M 表示情感记忆内容/强度,以及一个同维度的矩阵 P 表示记忆的稳子P 的保护。记忆P 的稳固性根据其被激活(A)和关联的情绪强度(E)而增强(速率为 μ),并自身也存在缓慢衰减(速率为 δP)。主动遗忘基于伦理/价值信号(v)和全局情绪强度(eglobal),通过函数(σ)计算遗忘倾向,并据此削弱记忆 M(强度 γ)。允许干扰,外部或内部的干扰信号(I)会削弱现有记忆 M(强度βI)。模型依赖外部输入,包括情感状态G(用于驱动激活和强度)、激活图 A、强度图 E、伦理信号v 和干扰信号 I。输出可以获取原始记忆M、稳固性P 或模拟可访问/有意识的记忆P⊙M。

模型将现象学(自然衰减)、尼采哲学(主动遗忘)、心理学(干扰、稳固)等多种理论概念,以及认知科学中的核心记忆机制(衰减、巩固、干扰)整合到一个统一的数学框架中。明确区分并量化了不同的记忆动态过程(衰减、稳固、主动遗忘、干扰),使得各个因素的作用可以被独立分析和调整。引入稳固因子 P及其动态更新,能够模拟记忆重要性不同、抗遗忘能力不同的现象,比单一衰减模型更符合直觉和心理学观察。建模实现了主动遗忘,包含了基于伦理和情绪的主动遗忘机制,使模型不仅能被动衰减,还能根据目标主动塑造记忆库,这对于模拟高级情感调节和适应性行为具有重要意义。提供了多个参数,允许研究者探索不同机制的相对强度和相互作用,模拟不同的 “记忆个性”或情境影响。

但是,情感与记忆表示进行了简化,情感输入 G是低维向量,难以完全捕捉复杂情感的细微差别和不同维度情感的混合状态。记忆矩阵M的内容是抽象的“ 强度”或“ 内容”,并未区分记忆类型(如情景记忆、语义记忆)或其内部结构和关联。模型基于离散时间步Δt更新,而现实中的认知和情感过程是连续的,这可能在模拟快速动态变化时引入误差或不自然的行为。十分重要的是模型采用了交互的线性假设:σ函数引入了非线性,但M的核心更新依赖于多个因子的乘性组合,这可能简化了现实各因素之间以及记忆单元之间可能存在的更复杂的非线性交互作用。记忆和遗忘的复杂性使得模型包含较多参数,确定这些参数的合适值,使其符合心理学实验数据,可能需要大量的调整和验证工作,需要进一步继续工作。模型的行为高度依赖于外部输入的质量和形式,如何从原始感知或内部状态生成这些有意义的输入本身就是一个挑战。模型的核心参数是固定的,固定就会有偏差,它不包含元学习机制,即模型无法根据经验调整自身的遗忘策略、稳固速率或对伦理/情绪信号的敏感度。

由于本文在于展示依据现有技术完全跳出纯概念分析以更精确的方式讨论遗忘和记忆的表征,忽略或未充分考虑诸多现实因素。现实过程是连续的,使用微分方程可能是更自然的表达方式,尽管会增加求解的复杂性。真实情感变化往往是高度非线性的,情绪可能在刺激达到某个阈值后才爆发,情绪强度不会无限增长,情绪状态的改变路径可能影响最终结果(从平静到愤怒,再回到平静,最终的平静状态可能与从未愤怒过的平静状态不同),当前的情感状态(由 M和 P体现)可能会反过来影响未来的输入,形成复杂的非线性反馈循环,目前模型对此表达不足。模型中的非线性主要体现在 σ函数的阈值效应上。记忆并非简单地衰减或被遗忘,而是在每次回忆时被动态地“ 重构”,可能引入错误或与其他信息融合。模型主要关注强度的衰减和消除,较少涉及内容的扭曲或重组。情感和遗忘深受认知评估、注意、目标、自我意识、反思等高阶认知过程的影响,有意识地采用某种策略去遗忘(抑制)或铭记,这些在模型中仅被简化为 v信号或激活模式 A。未能体现不同个体在记忆、遗忘、情绪调节上的先天或后天差异,也未考虑这些能力随年龄发展的变化。

我们的构建工作仍是一个有价值的尝试,成功地将多种与情感记忆遗忘相关的理论机制形式化,并整合到一个可计算的框架中。其优点在于理论的融合度、机制的明确性以及对“稳固性”和“主动遗忘”的显式建模。为情感计算中的遗忘机制提供了一个坚实的计算起点和基础框架。它可以用于模拟特定的遗忘现象、探索不同机制的相互作用,并为未来构建更全面、更逼真的模型指明了方向和需要克服的挑战(引入更丰富的非线性动态、更结构化的记忆表示与学习能力等)。

三、与灾难性遗忘相关的讨论

情感计算建模中必须讨论灾难性遗忘(Catastrophic Forgetting, CF)问题。旨在与人类进行长期交互、理解个性化情感反应或适应新环境/用户的系统,本质上面临着连续学习的需求,而神经网络在学习新任务时,会显著甚至完全丢失在先前任务上学到的知识或技能。这不仅是技术问题,也是哲学讨论的切入点,涉及AI 的知识表征与人类认知的比较、学习机制、可靠性、伦理风险以及当前AI 范式局限性。但我们往往要求机器发展出与人类完全一样的智能,特别是在学习、记忆、遗忘等核心认知能力上达到“和人一样”的水平,这可能包含潜在的张力,甚至在某些解读下可以被视为包含悖论或至少是目标上的内在冲突,因为这至少假设了人类进化适应性和工程技术中优化目标是一致的,但这个假设值得讨论。人类认知是进化适应的产物,人类的学习、记忆和遗忘能力是在漫长的生物进化过程中,为了适应特定环境、在资源(能量、时间、生物结构)限制下生存和繁衍而形成的。这些能力是适应性(adaptive)的,但不一定是最优(opti- mal)的(从纯粹的信息处理或逻辑完美的角度来看)。遗忘、错误归因、易受暗示虽然看起来是缺陷,但也被认为具有适应性价值。人类遗忘可以防止信息过载,使我们能更好地泛化和适应新环境。进化形成的认知捷径和偏见虽然会导致系统性错误,但在资源有限的情况下能快速做出“ 足够好”的决策。但AI 的工程目标常包含优化与超越,是在工程应用层面追求效率、准确性、可靠性和性能上的优化,目标是创造出超越人类能力的系统(例如,在围棋、蛋白质折叠、某些类型的图像识别)。因此需要假设人类进化适应性和工程技术中优化目标一致不成

立。要求AI 发展出和人一样的情感,还意味着机器可能要复制人类认知中的“缺陷”或“局限性”,从而让 AI 也具有同样的认知偏见,让 AI 像人类一样容易忘记某些细节,或 者更容易受到误导信息的干扰。AI 若精确复制一个为了在生物限制下适应性生存而演化出的、并非处处最优的认知系统,可能与追求更强大、更可靠,甚至超人性能的工程目标相冲突。AI 必须与人类一样不易灾难性遗忘的要求还预设了基底差异同一的 问题,人类的认知过程深植于其生物化学基础,这些生物过程具有其独特的动态特性、噪声水平和运作方式,而当前AI 主要基于硅基计算架构。要求基于完全不同物理基底的机器不仅在功能上,而且在情感处理过程的每一个细节上都“和人一样”,可能是一个不可能实现或至少是极其困难的目标。实际上仅仅模拟情感并不必须等同于复制心智状态,人的内在状态和体验本身就很难验证,又依赖于特定的生物基础,那么要求非生物的机器实现这一点就是一个逻辑上或物理上的不可能。

这两个预设蕴含着潜在的冲突,它可能迫使AI 复制人类认知的非最优特性,与 AI工程追求性能优化的目标冲突,也可能因物理基底的根本差异而难以完全实现,甚至在哲学层面(如意识问题)上不可能实现,当然这可能是基于对“智能”的狭隘定义,限制了探索超越人类模式的、其他形式的高级智能的可能性。哲学家要思考,批判现有AI 的情感表达、交互力时,揭示 AI 发展中一个核心的、尚未解决的问题:我们到底希望 AI 成为什么?是人类认知的不完美复制品,还是遵循不同原理、可能超越人类但又难以完全理解的新型智能?

灾难性遗忘源于AI,自然传导到情感计算领域,但实际上有多种有效的缓解策略,并没有成为阻止 AI 发挥其巨大应用价值的根本性障碍,也不会严重阻碍情感计算领域的进展。McCloskey 等 1989 年指出为了适应新数据而对共享参数进行的调整,会不可避免地干扰或覆盖先前存储的信息这一点,将其视为连接主义网络在顺序学习上的内在难题,30 多年过去,这没有阻碍技术进步,反而促使我们开发了大量的技术 来“优化”学习过程,以“缓解”这个问题。通过不同的策略(保护重要权重、重访旧知识、分配专属资源)来平衡模型的稳定性和可塑性,这些方法能够在各种基准测试中显著减少遗忘,使得模型在连续学习任务上的表现远超不做任何处理的基线模型。虽然没有一种方法能保证在所有情况下完全消除遗忘,但它们确实将问题从“灾难性”降低到了“可管理”或至少是“显著减轻”的程度,通过对学习算法或架构进行优化设计,遗忘的程度是可控的,而不是灾难性的。

然而,这种对于灾难性遗忘的技术追求,也值得我们在哲学与认知层面加以反思。正如哲学讨论所揭示,灾难性遗忘的出现,或许正源于我们极力想要“记住一切”,反而导致“什么都没记住”。类似地,人类依赖书写以增强外部保存,却不可避免地弱化了自身的内在记忆。当前主流的应对灾难性遗忘的策略,更多地是在提升系统对外部信息的存储能力,而非真正强化其自身的主动记忆或元记忆机制。存储能力的增强,是否可能以牺牲深度记忆能力为代价,反而削弱了系统对知识的内在把握与自我管理?我们面对的究竟是记忆问题还是外部存储问题?提升存储能力与提升深度记忆能力,这两者之间的目标、实现机制与意义其实迥异。我们自身究竟是“存储”的记忆的产物,还是“遗忘”与“重构”的产物?抑或,遗忘本身反而蕴含着认知系统最深的智慧?

本文建立的情感遗忘模型内置遗忘与稳固机制,从另一个角度模拟认知机制而非仅仅缓解技术问题,来处理长期记忆与学习问题的思路,很好地处理或“回避”了灾难性遗忘这个问题。灾难性遗忘最典型地出现在监督学习或强化学习的连续学习场景中,模型需要依次学习多个不同的任务或数据集,并且通常通过反向传播和梯度下降来优化共享的权重参数以最小化误差或最大化奖励。我们构建的这个情感遗忘模型,其核心是模拟记忆状态的演化,而不是进行监督式的任务学习。M 矩阵代表记忆的状态,其更新规则是基于模拟的认知/情感过程(衰减、稳固、主动遗忘、干扰),而不是基于最小化某个任务的预测误差来调整权重,这是其一。第二,在典型的神经网络中,灾难性遗忘源于参数覆盖,新任务的梯度更新会直接修改整个网络(或其一部分)的权重,这些权重可能对旧任务至关重要。我们建模中,记忆 M 的更新主要是通过乘性调制因子(de- cay factor, active forget factor, interference factor)来实现的。这些因子通常是[0, 1]范围内的值,它们会削弱或维持现有的 Mij 值,而不是用一个全新的值去替换(overwrite)它。即使是主动遗忘,也是将 Mij 向 0 削弱,而不是替换成一个基于新输入 G 的模式的值。第三,模型中的稳固因子 P 扮演了关键角色,P 的值会根据记忆的激活和情绪强度而增加。高 P 值会显著减缓记忆 M 的自然衰减(λ(1-P))。这相当于模型内置了一个机制来主动保护那些被认为重要或经常被提取的记忆,使其不易被后续的过程所削弱。这与许多旨在克服灾难性遗忘的AI 技术在理念上有相似之处,即保护重要参数。第四,模型包含一个干扰因子[1-βI*I(t)] 。当存在强干扰时,新输入可以显著削弱现有的记忆。这在效果上看起来有点像灾难性遗忘(旧信息丢失了),但其机制是不同的。这是模型中明确定义的一种“干扰”现象,而不是由于学习不同任务时权重冲突导致的参数覆盖,它更像是心理学中的前摄或后摄干扰,而不是神经网络训练中的灾难性遗忘。

四、结语

本研究立足于对当前情感计算哲学讨论中“ 理想化假设”的深刻反思,聚焦于长期以来被忽视的“ 遗忘机制”,揭示了遗忘在人工智能情感计算中不可或缺的关键作用与多重价值。本文的核心论点在于,遗忘并非情感计算的障碍或缺陷,而是构建更具人类情感真实性、伦理责任感和社会适应性的人工智能系统的必要组成部分,然而却在目前的情感计算研究中缺失。本研究构建的模型内置遗忘与稳固机制,缓解或“回避”了 AI 传导下来的灾难性遗忘问题。对遗忘机制的深入研究与合理应用,将最终引领情感人工智能走向一个更加成熟、更加人本,也更具伦理关怀的新时代,构建出真正服务于人类福祉、促进社会和谐发展的人工智能未来。

邱德钧(兰州大学哲学社会学院教授)、李玮农(兰州大学哲学社会学院)

免责声明:本网信息来自于互联网,目的在于传递更多信息,并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益,请及时联系我们,本站将会在24小时内处理完毕。