当前位置: 首页 » 资讯 » 新科技 » 正文

蚂蚁“灵光”初现

IP属地 中国·北京 光子星球 时间:2025-11-20 00:11:08

撰文| 吴坤谚

编辑| 吴先之

巴黎的埃菲尔铁塔在今天是技术浪漫的象征,但在其建成后多年承受“大而无用”的评价。它看似先进,却难以承载先进的技术任务。

曾经,蚂蚁集团的愿景与现实之间,也有同样的张力。

蚂蚁一直向外界强调自己是“科技公司”——它不仅长期探索支付与金融科技,更是做隐私计算、自研数据库、布局具身智能。蚂蚁不断垒砌的科技新业务像不断叠高的“铁塔”,世人皆知其前沿与壮观,却始终没能找到能被亿级用户日常使用、能真正成为入口的那个“技术用途”。

战略层面上,这一堵点可以被抽象成其对场景化入口的构建。11月18日,蚂蚁正式发布的全模态通用 AI 助手“灵光”,很可能是这一需求推动下的产物。


据介绍,灵光主打“自然语言 30 秒生成小应用”,支持动态 3D、图表、视频、地图等全模态内容,采用多智能体协作的 Agentic 架构,能在一次对话里生成“可执行、可互动、可调用后端能力”的 AI 小程序。目前,该独立应用已在各大应用商店上线。

不同于早期清一色出自支付宝小程序的AI应用插件(In-App AI),灵光自一开始便以独立应用的面貌面向市场。

最初以小程序问世的AI4H小程序AQ,最后也跳出支付宝外做了独立应用。“父凭子贵”,AQ的战略优先级甚至推动其所属的原蚂蚁数字医疗健康事业部升级为蚂蚁健康事业群。

前后对比,最明显的范式转变是蚂蚁不再执着于在支付宝生态内做AI。与蚂蚁持续多点投入科技一般,发展20年的支付宝同样是层叠复杂的“高塔结构”,AI在其中并不显眼,甚至会被拖慢增长节奏。

或许只有另起炉灶,才能找到蚂蚁未来10年的机会。

支付宝“前台变后方”

近两年来,蚂蚁曾多次从场景切入,以支付宝内小程序为载体,基于自身能力试水AI2C入口。如承袭医疗信息连接力的AQ,侧重拍照交互的探一探以及连接打通支付宝生活服务的支小宝、蚂小财。

于此,蚂蚁布局虽广,却相对琐碎,颇具投石问路的色彩——这些应用有的已经随组织调整成为集团核心支柱,有的却已被淹没在茫茫多的AI应用插件中。据QuestMobile数据,截至9月,仅主打理财的蚂小财在月活规模上进入AI应用插件前十,规模未破亿且复合增长率偏低。

推理大模型普及后,C端应用落地成为共识,遑论更早发现应用价值所在的蚂蚁。但这同样将绝大部分“功能价值”变成了用户随手可得的公共能力,造成AI2C应用基于推理、思维链能力打造的功能高度同质化,竞争势如血海。

甚至无需考虑到推理模型的因素,早期借短期功能优势+粗放投流攫取增长的AI独角兽便踩过了“功能”的坑。自2024年下半年开始,我们看到资源更雄厚的大厂,在应用价值挖掘上更为聚焦其与生态资源的整合,如百度文库、嵌入内容生态的抖音豆包和微信元宝。

这么看来,支付宝本应是蚂蚁做AI应用绕不过去的资源池,事实也是如此。但这不能解释为什么AQ以及灵光这些“后推理时代”的应用需要跳出支付宝之外。

这部分归因,落在了支付宝自身的支付工具特性上。众所周知,盘桓在移动互联网上空10余年的支付宝从来不缺用户,也不缺触达。只是AI应用需要的不止是流量,更多是“留量”——停留时长基础上长出来的使用、互动频次,才是构建应用与用户情绪连接,从而完成功能价值到情绪价值跨越的核心。

支付宝几乎所有的增长,都建立在“用完即走”的工具能力上。用户打开它,只为完成一件事情——支付。支付结束,停留也随之结束。


一如集团的科技叙事,进入移动互联网后,支付宝做了大量产品尝试。从社交导向的生活圈与兴趣社区到短视频、创作者体系等内容运营生态,最终都指向同一个堵点:为支付宝增加使用逻辑之外的维度。只是大部分试图延长停留时长的努力都像贴在铁塔外壁的装饰,并不改变结构本身。

换言之,用户日常生活的入口重建权根本不在支付宝的手中。

至于老本行支付,蚂蚁大可推出“碰一下”以及技术更先进的支付链路,但对支付宝而言,它们只是把“支付”做得更快、更多样,却缺乏一种可以沉淀“关系”的形态,而关系恰恰是 AI2C 时代最核心的能力。

从这个角度看,独立App可被视作是蚂蚁的一次战略层面的转身。并非应用不再需要整合支付宝生态的能力,而是将新苗栽在雨林之外,共享一片沃土的滋养同时没有参天大树争抢阳光,或许会长得更好更快。

以推出独立App的AQ为例,截至9月,其增长能力在规模前十的AI应用中位列前茅,对比7月时的复合增长率达83.4%。

只是AQ始终存在赛道与场景限制,更泛化的灵光才是蚂蚁应用矩阵中沉淀用户、积累关系、建立新习惯的 C 端入口。

“执行”能否成入口?

为了便于用户快速理解模型能力,降低使用门槛,OpenAI在GPT前加上一个“Chat”,框定了绝大部分AI应用的产品形态。

到了推理时代,从对话交互上长出来的基本功能链路是搜索——信息聚合筛选——提供解决方案。

从这个角度观察灵光,我们可以看出其与寻常AI助手应用的不同。灵光的所有功能堆砌,如多模态、Agentic、开眼、3D、秒级生成应用,都试图在用户与应用你来我往的对话基础上,增加互动的维度。

这基本沿用了灵光之前支付宝内小程序“探一探”的产品逻辑,清晰地对标过去支付宝使用场景的最大短板,即用户停留。

此外,灵光还有一层区隔在于设计UI。我们测试了灵光的回答,对于“声场是什么样的”这个提问,灵光生成的内容呈现明显的图文编辑色彩,在聚合信息基础上增加了花样字体、来自聚合信息的图片以及表格这样的结构化呈现。


打个不算恰当的比方,灵光好比是在常规AI助手的形态上加了个“135编辑器”。

在产品竞争中,这样的创新相对容易被模仿,其仅影响价值呈现,不能定义价值是什么。纵观移动时代甚至更早的产品,类似的设计并不鲜见,且往往依附于产品核心功能。例如苹果推出的灵动岛,时隔一年便成为各大安卓厂商标配。

更关键的是“闪应用”。产品上,其支持用户通过自然语言生成可修改、可交互、可调用外部能力的小应用,并能再次封装为新的功能。技术逻辑上,该功能是通过需求确定逻辑,以此调用集成的内部接口部署应用。

光子星球以“帮我做个测试声场的应用”测试了这项功能。可以看到,灵光调用了可画的接口完成了可视化界面。


自由性上,灵光不支持外部接口,限制了其面向P端的能力;实用性上,虽然目前AI Coding已经基本进化到杜绝语法错误,但大部分普通用户不具备准确描述需求的能力。这让其封装的闪应用停留在“玩具”层面,可以尝鲜,但市场上有茫茫多开发团队做出来的成熟产品。

用开发者的话说,“水平越高的产品经理,越难在Coding的时候犯错”。因为他们能精准描述需求,交代好技术、项目背景环境。

在未来主义者眼中,这些缺陷是需要被“低估”的短期困难。长期看来,将用户需求拆解,执行复杂调度并做出多模态展示的能力,具备成为AI时代GUI(图形用户界面)的潜力。

更重要的是,撇开内容呈现的花里胡哨,灵光与其他AI助手的最大区别在于“可执行性”。这一特征与支付宝现有的支付体系与生活服务等基建高度匹配。

支付宝过去十年想做内容生态想得很辛苦,却始终不得其法。因为支付宝的强项从来不是内容,不是社交,而是执行交易、执行任务、执行服务

由此看来,推出灵光的根本目的在于将蚂蚁在过去20年积累的强大“执行力”,转化为AI2C时代的“行动力”。

蚂蚁绕行突围

11月19日,灵光的首日下载量突破20万,其UI视觉外衣下的“可执行”能力初露锋芒。

同样不可回避的是,灵光未尝不是迫于生存压力下的“绕行突围”策略。在AI2C的大入口竞争中,蚂蚁面对的对手都具备其难以正面抗衡的优势。

元宝天然链接全国最大社交网络与长图文生态,首页顶部搜索栏丝滑嵌入了“深度思考”按钮,同时支持直接上传公众号内容;长期霸榜AI2C的豆包自不必说,短平快的内容持续刺激感官,有了时长自然就有更多交互频次与使用心智。

互联网大厂外,手机厂商声名不显,却也牢牢把持系统级入口。原生操作能力与不容置疑的系统权限,直接让第三方数据公司在统计测算AI2C应用时,大部分维度都将手机厂商放在样本池之外。

AI几乎所有能力来源于对过去产生结构化数据的学习,“输入-输出”的底层逻辑决定AI应用的价值、上限源自资源整合。在这方面,蚂蚁天然落后于盘踞在不同领域的其他玩家——它未尝不想通过AI让支付宝活出第二春,但两相权衡之下,最终还是选择让灵光走出“家门”闯天涯。

而今,灵光的产品形态还处于萌芽期。颇具可玩性的“闪应用”需要重走一遍图文大模型的提示词优化之路,亦可社区化,延展成AI小应用市场;延续“探一探”的实时视频流解析,也能连接蚂蚁广泛投入的具身智能,充当物理世界的AI信息解释层。

埃菲尔铁塔真正成为巴黎的象征,是在它后来被用于军事通信、战略监听、广播发射等关键任务之后。那一刻起,这座铁塔不再是“大而无用”的高塔,而变成了真正承担功能的科技载体。

蚂蚁过去十年的科技叙事,也一直缺少这样一个“真正承担功能的入口”。它的技术像不断加固的塔身,但缺乏一个能被用户真正使用、能让技术落地、能不断沉淀用户价值的用途。

灵光的出现,是蚂蚁第一次将技术叙事变成入口能力的尝试。它能否成为蚂蚁的“电报塔真正被点亮”的那一刻,还需要时间验证。但有一点确信无疑:蚂蚁不再投石问路,而是“孤注一掷”,让入口在支付宝之外长出来。

微信号|TMTweb

公众号|光子星球

别忘了扫码关注我们!

免责声明:本网信息来自于互联网,目的在于传递更多信息,并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益,请及时联系我们,本站将会在24小时内处理完毕。