当前位置: 首页 » 资讯 » 新科技 » 正文

刚刚,北京建了一座AI工厂:目标10万P算力,日产10万亿Token!

IP属地 中国·北京 量子位 时间:2026-06-17 22:14:18

金磊 发自 凹非寺
量子位 | 公众号 QbitAI

AI圈卷到现在,开始建工厂了。

这不,就在刚刚,北京就开了一家,包含两个核心组成部分:

一个是训练工厂

目标算力规模10万P,负责把通用大模型、行业数据和算力资源放进来,炼成金融、制造、政务、科研等行业能用的专业模型。

另一个是Token工厂

目标日均产能10万亿Token,负责把这些专业模型封装成企业可以调用、可以计量、可以结算、可以稳定交付的专业Token。



这便是九章云极在2026全球智算科技峰会暨九章云极战略发布会上,正式抛出一个新战略——AI工厂

它听起来点像把AI产业搬进现代化工厂:前端炼模型,后端送智能。

然后中间再用DCU(1度算力)度量算力投入,用专业Token(面向业务任务的智能价值单元)度量智能产出,再让业务数据回流,继续推动模型迭代。

由此带来的效益,用一组数据展示便是:

10万P目标算力规模、10万亿目标Token日均产能、1000倍目标综合降本、计划孵化1000个高价值模型与智能应用。

更直观的,一张图解如下所示:



不过比起这些数字来说,从九章云极的这次战略发布来看,智算云的商业逻辑正在发生变化——

它不再只回答算力够不够,还要回答算力能不能变成真正可交付的智能。

而这,便是九章云极此次动作的目的,把这上面个问题试图工程化。

AI工厂,到底怎么运转?

要理解这座AI工厂,我们首先需要了解当前企业在拥抱大模型时面临的真实痛点。

过去,大家热衷于讨论的可能是模型参数有多大、是不是开源、打分高不高;但现在,业务一线的真实拷问是:

模型能不能真正跑进我们复杂的业务系统?在超高并发下,能不能稳定输出可预期的结果?每一次API调用的成本,业务部门能不能算清账、算赢账?

这已经不是一个纯粹的算法竞赛,更准确的说,应该是一个典型的工程与工业化问题。

毕竟阻碍AI落地的现实瓶颈往往不在大模型本身,而在其背后的整套底层智算基建,包括算力调度是否高效、异构算力能否统一纳管、推理成本是否足够低、任务失败时系统能否自动感知并自愈……

因此,九章云极推出的AI工厂,本质上是在用一套标准化、规模化、高可靠性的工业化流水线,去重构智能的生产与交付体系。

从AI工厂的整个版图来看,可以分为四个关键部分来看。

投入侧:首创“一度算力”(DCU)

这是解决如何购买算力的问题。

长期以来,算力行业最大的痛点就是资源不标准、计价不透明、投入不可量化

过去,企业通常需要去租用GPU、规划网络拓扑、考虑存储带宽以及机器的使用时长。

这种粗放的租赁模式,就如同在初期的电力时代,想要用电,必须自己去买煤炭、租发电机,甚至自己去拉电线,门槛极高、成本混乱、无法规模化。

九章云极在行业内首创了“一度算力”计量单位,将其定义为312TFlops×小时(每秒钟312万亿次浮点计算乘以一小时)。



△九章云极董事长,方磊

它将底层芯片(异构的GPU、NPU)、网络、存储、使用时长及实际利用率等极其复杂的物理资源统一折算计量。

对客户而言,算力采购从此变得像买电一样简单,按“度”付费、所见即所得。



生产侧:训练工厂

训练工厂解决的是智能“从0到1”的生产问题

通俗来讲,就是把通用模型、行业数据、算力资源放进来,通过数据处理、领域精调、强化学习、评测反馈等流程,训练出金融、制造、政务、科研等场景可用的专业模型。

这里的重点不只是有多少卡。

训练工厂强调的是千卡到万卡级集群、高密度网络存储、故障自愈、跨地域调度,以及从数据、训练、评测到部署的全流程工具链。训练工厂能够将通用基础模型,升级为适配各行各业的专业任务模型

通用模型存在天然的数据边界与能力边界,无法覆盖企业私有数据、行业Know-How、复杂业务流程。而训练工厂的价值,就是把行业专属知识沉淀进模型,让AI从会聊天、会答题,升级为能拆解任务、能自主决策、能风险判断、能闭环落地的产业智能体,真正适配企业生产环境。



封装侧:Token工厂

Token工厂解决的是智能“从1到N”的交付问题

训练工厂生产出专业模型之后,模型本身还不是企业能直接消费的商品。企业真正需要的是稳定API、SDK、权限体系、模型版本管理、监控告警、计量计费和服务保障。

Token工厂就是把训练工厂产出的专业模型,封装成可调用、可计量、可运营的专业Token

这里的Token,也不只是大模型里的技术计数单位。按照九章云极的定义,专业Token更接近一种面向业务任务的智能价值单元。不同任务、不同模型、不同服务等级,都可以通过Token被计量和结算。



产出侧:越用越强,越强越便宜

至此,AI工厂的核心飞轮闭环就此形成:

DCU度量投入 → 训练工厂冶炼专业模型 → Token工厂转化为专业Token → 企业消费Token并回流业务数据 → 模型持续迭代

我们可以把它理解为“越用越强,越强越便宜”的增强回路。在这里,数据不仅是原料,也是模型进化的养分。



值得注意的是,在这一闭环中,九章云极重新定义了Token

他们认为,面向消费者的泛化Token单价已经由于市场竞争趋于零,其价值正逐渐见顶。而面向产业的、具有明确 ROI(投资回报率)的专业Token,才是驱动产业智能化的核心组件。

九章云极将这些专业Token进行了清晰的价值分层,并将其战略重心聚焦在后两者:

消费级Token:主要服务于日常AI应用、内容创作,追求极致体验与规模普惠,如同稳定经济的基础电力;专业级Token:封装了行业深度Know-How与私有数据,充当金融风控、质量检测、政务服务的数字专家,保障流程安全、合规,让客户买到确定的效率与风控价值;前沿级Token:面向复杂任务自动化与科研突破。例如,封装了多步骤、多工具的端到端仿真或科研工作流,直接服务于药物发现、新材料研发、城市级系统优化等曾经不可解或成本极高的科学边界。



从租卡到用Token,企业AI开始变轻了

过去企业做AI,往往是一条漫长的重资产建设路径。

包括多方协调、艰难地在市面上找芯片、拼凑卡;组建专业的集群运维团队,解决算力中断、故障恢复;搭建复杂的开发与模型训练环境,再进行私有化部署。

这一套流程下来,周期通常长达6到12个月,还没看到业务效果,前期资本开支已经堆成了天文数字。

而在九章云极AI工厂的模式下,针对不同类型的市场玩家,整个接入路径被彻底变轻、变薄

针对大模型公司和垂类AI企业:从训练开始

大模型创业公司或者垂直行业的AI领头羊,自身拥有极强的算法和数据能力,但往往被算力运维和成本压得喘不过气。

对于这类客户,他们可以从训练工厂无缝切入。AI工厂提供千卡到万卡级的极致弹性算力集群,不仅保证大规模模型并行训练的高效运行,还提供跨地域调度和故障自愈的底座。

当模型在训练工厂中训练、精调、评测完毕后,客户无需再折腾复杂的转转运环境,可以直接在云端一键Token化分发至Token工厂。

AI工厂可以说是帮这类企业打通了从研发到商业化上线的这条路,让算法科学家能够将100%的精力聚焦于模型本身。

针对行业客户和SaaS公司:从推理开始

对于绝大多数金融、制造、政务领域的实体企业和SaaS开发商,他们未必有必要训练自己底层的基座大模型。他们更现实、更迫切的需求,是在现有的客服、风控、质检或办公系统中,引入成熟好用的行业专业智能。

对他们而言,Token工厂提供了一条极轻的消费型路径:不用买卡、不用建集群、不用招募昂贵的底层运维团队。

平台上已经预置了50多款主流基座模型以及多款面向金融、制造、政务、科研等真实场景精调完毕的模型,这些模型和能力均已就绪。

企业可以直接调用已经封装好的Token服务,按需消费、按量付费,将沉重的基建投资转变为灵活的运营支出。

过去需要大半年的项目建设周期,现在如果从调用专业Token切入,最快只需两周左右即可完成业务概念验证。

针对开发者和AI Agent:还有专属入口

针对开发者、科研人员与AI Agent场景,九章智算云打造轻量化算力入口,解决本地算力不足、云端环境繁琐、远程调试卡顿等行业痛点。

对于AI工程师而言,头疼的日常莫过于代码在本地,算力在云端。为了解决远程SSH卡顿、环境同步繁琐的痛点,九章智算云已经上线了IDE插件。

现在,开发者可以在VS Code、Cursor等常用本地编辑器中,实现直连云端GPU。开发人员在本地写下代码,算力直接在云端跑实验,并且能够根据任务自动开启和关闭,不用不计费。

同时,九章智算云还将陆续推出CLI、SDK以及Skills Hub。无需理解底层复杂的硬件拓扑,使用时通过简单的交互即可提交并运行任务使用算力。

与此同时,九章云极在发布会上同步启动智算开放计划,面向全球开发者、科研团队和高校用户开放普惠算力,消除创意与智能落地的阻碍。

算力战,现在拼的是卖生产力

从行业视角来看,九章云极这次发布AI工厂,踩中的是智算云市场正在发生的一次转向。

早期,市场拼的是有没有卡。大模型爆发后,算力短缺是硬约束,谁能提供更多GPU,谁就更有话语权。

随后,竞争开始转向能不能用好卡。算力规模上来后,GPU利用率、训练稳定性、跨地域调度、推理成本、异构硬件管理,都会直接影响有效算力。

现在,企业更关心的是第三件事,也就是能不能把算力真正交付成业务结果。

算力是投入,模型是中间产物,Token是产出,业务效果才是最终价值。这也是AI工厂概念最核心的变化:九章云极没有把自己只放在算力供应商的位置上,而是试图成为智能生产力的组织者和交付者。

它的思路可以理解为用DCU定义算力投入,用训练工厂生产专业模型,用Token工厂建设智能交付网络,最终把智能能力送到企业和开发者手里。



当然,智算云市场不缺宏大概念,最终还要看真实交付。客户会追问的,仍然是几个具体问题:接入是否简单?成本是否真的下降?服务是否稳定?账单是否透明?业务效果是否可验证?

尤其是1000倍综合降本这样的目标,足够吸睛,也需要在更多场景里被持续验证。它背后依赖的,不只是硬件堆叠,而是全栈自研OS、算电协同、全局调度,以及围绕训练和推理的系统级优化。

这也是AI基础设施真正拉开差距的地方。

长期来看,模型会继续迭代,硬件会继续更新,价格也会波动。真正稀缺的,是把算力、模型、Token和业务价值串起来的工程系统。

九章云极这次提出AI工厂,意义正在于此。把智算云的竞争,从谁有更多算力,推向谁能更稳定、更低成本、更规模化地交付智能。

AI圈开工厂了。

接下来要看的,是这座工厂能不能真的开足马力。

免责声明:本网信息来自于互联网,目的在于传递更多信息,并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益,请及时联系我们,本站将会在24小时内处理完毕。