当前位置: 首页 » 资讯 » 新科技 » 正文

飞书搞了个AI分级体系,一上线就把一堆产品打回原形了

IP属地 中国·北京 编辑:沈如风 数据猿 时间:2025-07-10 22:23:51

“飞书想建立AI产品分级体系,它的底气是什么?

2025年,AI几乎无处不在。从智能助理到AI会议纪要,几乎每一家To B软件公司都在快速叠加AI能力,争抢“AI+办公”的未来入场券。对企业而言,仿佛不接入AI,就像还在用功能机时代的办公系统。

但热闹背后,越来越多企业管理者陷入一种“AI疲劳”:许多AI功能看起来令人惊艳,真正上线使用后,却不是响应缓慢、就是内容敷衍,甚至完全“答非所问”。AI产品成了企业的“PPT装饰”,更像是为发布会准备的“卖家秀”,而非真正解决业务难题的“工具人”。

一句话,企业到底该如何判断一个AI功能是“好看”还是“好用”?

就在这股技术与焦虑交织的洪流中,飞书在其2025年7月的发布会上,抛出一个颇具分量的新概念——AI应用成熟度模型。这是一套将企业AI应用划分为四个成熟度等级的评价标准,试图用清晰可量化的标准,把“AI好不好用”这件事,从主观感知拉回理性评估。

M1–M4四个等级到底怎么分?

“AI应用成熟度模型”这一术语,听起来略带技术门槛,却准确击中了当前To B企业面临的一大现实:AI到底该怎么评估?在产品页面“写得天花乱坠”、实操落地“一地鸡毛”的今天,飞书尝试用一套四级分类,把“能演示”和“能用”这道鸿沟,正式划清。

四个等级,一眼看懂企业AI的“进化路径”:

为了帮助大家更好理解模型,我们对其做了一些“翻译”,并做了下面表格:

这四个阶段的划分逻辑,不是根据模型大小、算法复杂度,而是站在企业使用者视角:你能不能上线用?能不能持续用?用完有没有实际业务提升?

与“科研AI”划界,飞书想强调的是“落地工程性”。

传统AI领域有很多技术评估维度,比如BLEU分数、推理速度、参数量等等,但对企业CIO或业务负责人来说,这些术语常常只是“玄学”。飞书模型的突破之处在于,它用非常贴近“业务落地感”的语言和等级,把AI的实用性颗粒度做了拆解。

换句话说,这是一个从产品视角出发的AI评估标准,不是技术人之间的炫技,而是业务人与工具之间的契约。

为什么企业AI需要“成熟度模型”?

AI正在从技术奇观变成生产工具,但一个被忽视的问题是:我们拿什么来判断一款AI产品,是否值得在企业中大规模部署?

在消费级市场,用户靠“好不好玩”“用着爽不爽”来评估AI,而在企业级市场,没有任何一个CIO会用“科技感”来作为选型依据。他们更在乎的是:能不能快速上线?能不能跟现有系统打通?用完之后,是锦上添花,还是雪上加霜?

然而现实是,大量企业AI产品还停留在“展示即结束”的阶段。很多厂商为了追热点,仓促将通用大模型能力包裹进现有产品,PPT上是“AI驱动”,真正使用时却是:“问了三遍,还答非所问;总结了一页,会后没人敢用。”

这正是企业AI落地的“卖家秀–买家秀”悖论。

☆成熟度模型的意义在于:用一把“应用标尺”,重建信任

飞书提出M1–M4四级成熟度模型,其实在做一件至关重要的事:把企业对AI的期望值校准,把供应商对交付能力的承诺标准化。

从“只讲模型参数”到“讲清产品可用性”,这本质上是一次视角的转变:

对企业用户来说,成熟度模型让他们可以设定合理预期,不再被“AI万金油”式销售术语蒙蔽;

对产品设计者来说,模型变成研发路线图,知道什么是合格的交付标准;

对整个市场来说,这是一次从“无标可循”走向“共识定义”的进化。

飞书不是第一个尝试分类模型的公司,但它的特别之处在于——这次不是实验室发布的技术论文,而是一家实际运营AI产品的公司,站在一线,把模型与产品逐一绑定、现场验证。

这让这个模型的意义,不只是理论,更具有“工程实操价值”。

模型不是空谈,

飞书用产品一一对标成熟度等级

相比空泛的概念模型,飞书更具说服力的一点在于,它同步公布了多款AI产品,飞书不是停留在“讲模型”,而是用产品去定义模型、验证模型。下面,我们来看几个此次飞书发布的产品,并试图将其与上面的AI应用成熟度模型对应起来。

☆M3标准:飞书知识问答——你的“企业豆包”

根据官方材料,飞书知识问答已达到M3级,即“成熟应用、可以大规模使用”。

无需企业构建知识库,即可“开箱即用”;

能“穿透组织”,理解语境,提供基于企业内部信息的准确回答;

就像是一个理解公司全貌、能回答“企业问题”的“企业豆包”。

这意味着,知识问答具备跨部门、跨角色使用的稳定性,是一个可广泛部署的AI“助手型”产品。

☆M4标准:飞书会议——实时总结的成熟AI

飞书会议达到M4标准,属于“完全成熟,在适合的任何场景都可使用”的产品。该产品支持会中实时总结,而非仅在会后回顾;能自动生成纪要、输出待办事项,并通过文档发送;准确率与逻辑概括能力“相当成熟”。

这表明飞书会议不仅能听懂,还能“提炼”、“记录”并“执行”后续任务,是典型的高成熟度AI产品形态。

此外,飞书还发布或升级了多个具备AI能力的产品,也在逐步靠近M3及以上标准。

☆多维表格:功能跃迁中的“王牌产品”

虽然飞书未明确将“多维表格”归入成熟度模型等级,但从其产品更新幅度来看,它正向M3级靠近:月活接近千万,标志其迈入成熟工具产品品类;支持“拖拉拽”搭建业务系统,兼顾美观与实用;单表容量达1000万热行。

这使得多维表格不仅是表单工具,更开始具备“业务平台”的潜质,对小微企业与大型流程管理者都构成实际可用价值。

此外,飞书还推出了AI开发套件,形成了更系统的企业AI能力框架。

◾飞书妙搭(企业AI系统搭建工具)

该产品让AI Coding快速落地产品思考,类比为“企业的无限产品经理和初阶开发人员”,可自动输出原型、生成系统。

◾飞书Aily+aPaaS平台

Aily为企业级Agent平台,已在公牛集团、美中爱瑞等公司落地;aPaaS平台实现AI加持的PaaS化开发,强调“效率、稳定、复用”的平衡

这些构成了飞书在更深层次的AI基础设施布局,虽然未在材料中明确打标签,但显然是朝着高成熟度、高扩展性方向演进的产品组合。

AI的“L1-L5”时刻到了吗?

飞书模型的行业意义与市场震动

自动驾驶行业早在数年前就确立了一套全行业通用的分级模型:L1到L5,定义了从人类辅助到完全无人驾驶的五个阶段。这套模型并不仅仅是技术评估标准,它在根本上重新组织了整个产业链——帮助监管者判断风险、帮助企业评估能力边界,也帮助公众建立对“自动化”的现实认知。可以说,没有L模型,就没有今天自动驾驶的理性竞争格局。

而飞书此次提出的“M1–M4 AI应用成熟度模型”,在本质上正是对企业AI落地路径的一次结构化、工程化重构。这不仅是一个模型发布,更可能是“企业级AI”真正走向成熟产业阶段的标志性事件。

☆模型之于产业,不是修辞,是基础设施

飞书模型的提出,首先是一种对当下AI产品泛滥但落地稀缺现象的清算。在过去一年中,企业面对AI时,往往只能依赖“演示效果”和“销售口径”来判断其价值,而非清晰的标准。飞书此次以“M3=成熟可用、M4=全面通用”的方式,给出了明确的能力刻度。这种能力刻度,不是技术参数维度的“token长度”或“训练数据规模”,而是以“可大规模部署”和“适配多场景”的可用性为核心,强调真实环境下的稳定性、泛化能力与交付效果。

换句话说,它不问模型能不能生成“惊艳内容”,而是问:这个AI功能在公司里能不能顶得住实际使用?能不能连续跑?出错率多高?

这正是To B场景下最需要的理性衡量方式。也正因如此,飞书模型与L模型之间产生了共振:它们都尝试将“看不见的智能系统”拉入可以评估、可以管理、可以决策的框架之中,赋予市场真实的参考体系。

☆飞书想做的,是定义“可信AI”的使用上限

更深层次看,飞书通过这套模型的意图并非只是帮助客户选型,而是试图建立企业AI应用的行业标准语法。在一个尚无权威机构给出通用评估体系的市场中,谁先给出一套被验证、被采用的结构化标准,谁就拥有了定义未来的先手权。

从发布会披露的信息来看,飞书并不是“模型先行、产品随后”,而是反其道而行之:用多个真实产品(知识问答、AI会议、多维表格等)作为标准“标杆”,反向映射出这一模型的四级结构。这种从底层产品能力抽象模型的路径,比凭空建构模型更有操作性,也更容易赢得行业信任。

它背后折射的是飞书团队对“工程视角AI”的理解——AI产品不是创意、不是卖相,而是一套能承载组织信任的生产工具。

☆企业级AI的下一阶段,需要共识而非炫技

一个重要的判断是:飞书这次的模型发布,将会引发AI工具厂商之间的“成熟度竞赛”。就像自动驾驶厂商不能再用“我们很先进”一笔带过L几级一样,未来AI产品也将无法仅凭一句“用了大模型”就获得企业青睐。客户会开始反问:你们是M几?在哪些场景部署了?准确率多少?稳定性如何?

这对市场生态是一种积极的“清场效应”。它迫使厂商从“炫技”回到“交付”,从“拼参数”回到“拼耐用度”。

而这,正是一个行业走向真正成熟的开端。

你的AI,用到了第几层?

AI正从“demo吸睛”走向“场景决胜”的阶段。当越来越多的企业开始意识到:AI真正的价值不是能生成一段漂亮的文本、画一幅惊艳的图,而是能否在流程中持续稳定地产生价值时,我们其实已站在一个全新时代的门槛上。

飞书提出的“M1–M4 AI应用成熟度模型”可能不是完美的答案,但它的出现,至少为长期混沌不清的“企业AI落地标准”提供了一个结构化的起点。

这个模型的意义,不止在于帮助飞书解释自己的产品,也不仅仅是一次品牌自证,更像是一面行业镜子——它让企业有机会回过头来问自己:

我们现在用的AI功能,真的是在解决问题,还是只是在展示技术?

我们花了大量预算接入AI,它在日常的流程中真正发挥了多少作用?

我们是否有评估一款AI系统“好不好用”的标准,而不是“新不新鲜”的情绪?

在AI从“先锋试验”向“主流基础设施”转变的当下,这些问题值得每一个企业决策者、产品经理甚至一线员工思考。

如果你所在的企业,已经部署了多种AI应用,不妨回看一下你们的工具清单,用“M1–M4”的视角去做一场自测:哪些功能可以称为成熟应用?又有哪些,其实还停留在“演示”阶段?

而如果你是一个在思考AI产品设计或采购路径的从业者,不妨把飞书这次的模型作为一个“起点模板”——未必非要照搬,但至少,它给出了一个可以被沟通、可以被质询的语言系统。

企业AI的未来,属于那些“最能稳定服务流程、最能交付真实价值”的系统。飞书这次迈出的是定义标准的第一步,接下来要回答的问题,将是:谁能持续站在M3与M4之上?谁能用产品把成熟度走成护城河?

你的AI,现在用到了第几层?

免责声明:本网信息来自于互联网,目的在于传递更多信息,并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益,请及时联系我们,本站将会在24小时内处理完毕。