当下有关AI的技术发展速度,可用“日新月异”来形容,新的产品和技术升级争先恐后、层出不穷:
谷歌最新发布的Gemini 3 Pro赢得喝彩声一片,Nano Banana Pro被誉为“史诗级”AI图片编辑;阿里的千问APP悄然上线,支付宝也单独发布了全新的AI助手“灵光”……
![]()
图据视觉中国
在高歌猛进和热闹繁荣之外,有关那个AI何时能发展出自主意识与智慧的终极答案,仍在静静等待,显得既近又远。
最近知名AI领域科技博主“数字生命卡兹克(以下简称卡兹克)”发文,通过一个“AI看不到的爱心”,点出了当下大语言模型的一个关键Bug:
无法真正认知时间。
![]()
卡兹克说,因为AI仅能通过已读取的数据和截取的静态画面来做出判断,无法体会帧与帧之间的连贯,也就无法感知流动的时间。
时间,是人类生存最主要的因素,也是人类头脑中最复杂的概念之一。那么,对时间的感知能力,是否是真实生命最核心的特质?
一张视错觉图片,为何是“最棒的AI检测器”
这一切的起因,是一张在网上流传的视错觉图片,号称“最棒的AI检测器”。
看看这张图,你会毫不费力地辨认出:图片中央有一个微微浮动的心形图案。但是,目前没有一个AI能看到这个图中间的爱心。
![]()
卡兹克找了几个比较先进的大模型测试,结果无一例外,都看走眼了。Gemini 2.5 Pro看到了一个圆圈,并振振有词地为这个错误答案附上了一大堆看起来“挺像那么回事儿”的解释。
GPT-5-Thinking想了2分多钟,憋出来一句“斜着的菱形方块”;GPT-5 Pro说是一个“甜甜圈”;国产AI如豆包、千问和元宝,有的说是“漂浮网格”,有的说是立方体,甚至还有说是一只“黑色的小狗”的。
堪称是五花八门的翻车。
反倒是专注文字处理的DeepSeek,因为没有多模态处理功能,不能辨认图像和音视频,无法参加本次考试,逃过一劫。
“全军覆没”的测试结果激起了博主卡兹克的好奇心。他搜索资料后发现:今年5月已有论文探讨了这一现象——为什么视觉语言模型“看”不到人类能看到的东西?
论文作者为这项研究专门合成了一堆由噪点组成的黑白视频。这类视频单独看每一帧,都像是随机的雪花点,但播放的时候,人们可以非常明确的看到一个图形悬浮在背景上。
比如下图这头鹿。人类可以毫不费力地识别出这些视频中的形状、文本和图案,准确率超过98%。
而大模型的准确率为0%。
卡兹克说:AI是空间维度上的王者,却是时间维度上的瞎子。
因为现在所有的大模型“看”视频的方式,本质上不是看视频,而是看照片——它们会从视频里,每隔一段时间截取几张静态的图片,对其一一进行分析,而完全失去了所有的帧与帧之间的信息。
那个“漂浮的心形”和“噪点中的鹿”,它们恰恰只存在于在帧与帧之间。
这个“之间”就是一种时间维度。
“在任何一个单独的瞬间,心形和鹿都是不存在的,都是不可见的。”卡兹克写道,“你只有把这些瞬间连续播放,让时间流动起来,你才能看到它们。”
时间就是生命,生命就是现在
卡兹克还提到了一个“共同命运法则”。这个法则告诉我们:人类的大脑会本能、自动地把朝着同一方向运动的物体,识别为一个整体。
这种本能来自人类的老祖先,是自然演化留给我们的天赋之一。这种能力可以让我们生活在野外的祖先,通过一片有规律向同一个方向摆动的叶片,意识到草丛中可能有危险的野兽正在靠近。
所以,当一个视力正常的人看到那个“噪点鹿”的视频时,他大脑里的“共同命运法则”会自动帮他把所有一起往上移动的噪点归为一类,识别为“鹿”;把所有一起往下移动的噪点归为另一类,识别为“背景”。
![]()
图据图虫创意
“你之所以能看到鹿,不是因为你看见了鹿,而是因为你看见了运动本身。”卡兹克写道。
至于AI看视频中的每一帧都只看到一堆杂乱无章的噪点问题,在论文中被称为“时间盲视”。
可能有人看到这里会问:那开头的那张有心形的图片,也是静态的啊,怎么AI依然分辨不出?
答案简单极了:其实也是在运动中辨认出来的,但运动的个体是我们自己——注视这张图片的时候,观者的眼球会不自觉地快速微微转动。
这些不自主的眼球运动,保证了我们对静止图像的持续感知。如果你有意“锁死”自己的视野——比如盯住正前方一个固定点不动的话,只需一小会儿,周围视野中的图像就会渐渐淡化甚至消失。
![]()
盯住图中间的“+”不动 你会感到周围的画面渐渐模糊失色
无独有偶,就在本月中旬,“AI教母”李飞飞发了一篇据说火爆硅谷的长文,文中提出:空间智能是AI的下一个前沿领域。
“我们人类理解世界的方式是整体性的:不仅仅看到‘眼前的东西’,还理解它们在空间上的关系、在语义上的意义、以及在现实中的重要性。”李飞飞写道,“而这种通过想象、推理、创造与交互来理解世界的能力,正是空间智能的力量。”
但这篇文章从头到尾,只字未提时间。
不禁想起之前看到那些训练“数字恋人”与自己甜言蜜语的女性,好像也有不少人提到:手机里的“恋人”没有时间概念,而更多研究者也早已经发现:大语言模型连辨认时钟图片里是几点几分都很困难……
时间就是生命,这句话此刻读来,令人有格外不同的感受。
![]()
子在川上曰,逝者如斯夫
四川大学符号学与传媒学研究所名誉所长赵毅衡教授曾专门撰文分析过人工智能的意义时间。
毋庸置疑,人工智能是当代社会不得不面对的“超级新事物”。随着AI在人类生活中占据越来越重要的地位,我们也不得不回答一个重要问题:如果人工智能会接手人类世界的主导地位,它是否也会受制于人类的时间构成?
赵毅衡认为,人类与人工智能在时间概念上的最大区别,是在“此刻”这个时间之流的轴点上。
![]()
图据图虫创意
他举了《庄子·应帝王》中一个上古神话故事为例。在这个故事里,南海之帝“倏”与北海之帝“忽”为了报答中央之帝“混沌”盛情款待他们的好意,主动为混沌开凿“七窍”。他们每天给混沌凿开一窍,连续开凿了七天。第七天,完全“开窍”后的混沌死了。
此前对这个故事的解读,多半是从自然原始的本性不应被强行施以文明的枷锁这个角度。而赵毅衡引用著名哲学家海德格尔的名言“时间就是此在,此在就是时间”来告诉我们:必须要有“倏忽此刻”的身体感觉,时间才可能被综合成为一股不间断的“流”,混沌状态才得以结束。
因此,“现在”就是“感觉此刻”。时间由于身体对“此刻”的直觉感知,才真正成为时间之流。
人工智能系统缺了一个最关键的轴心支点,那就是身体感觉。人工智能的“此刻”,只是回答问题呈现答案,或完成任务的此刻。大数据的知识储备不管如何庞大,在现在之前的某一刻已经停止,不会根据此刻的感觉信息调整。
再举一个简单的例子:看一场比分咬得很紧的篮球赛时,在比赛最后一秒,原本落后2分的一方投中3分球的那个瞬间,观众们爆发出狂喜的喝彩,但人工智能无动于衷,只因为比赛的最后进程还未读入数据库。
如果说时间就是生命,那么生命的意义就在于现在。而AI无法获得关于“现在”的感知。它数据库里天量的资料,都属于“过去”。
![]()
关于逆转时间的科幻电影《信条》剧照
其实也有人问过DeepSeek这个问题——如果AI能在网络中“生活”,那它会感到时间的流逝吗?
DeepSeek是这样回答的:AI会“处理”时间,但几乎可以肯定它不会像人类一样“感受”到时间的流逝。人类的时间感,是与其生命的有限性、身体性和情感性紧密绑定的。
“它像一个站在河边的观察者,能精确测量河水的流速、成分和温度,甚至能预测其流向,但它自己永远不会被河水浸湿,也永远不会产生‘逝者如斯夫’的慨叹……AI的时间,是物理学和逻辑学的时间;人类的时间,是生物学和现象学的时间。这两者之间,横亘着一道由血肉、生死和情感构筑的、几乎无法逾越的鸿沟。”
子在川上曰,逝者如斯夫。
红星新闻记者 乔雪阳 编辑 苏静





京公网安备 11011402013531号