当前位置：首页 » 资讯 » 新科技 » 正文

刚刚，北京建了一座AI工厂：目标10万P算力，日产10万亿Token！

IP属地中国·北京 量子位 时间：2026-06-17 22:14:18

金磊发自凹非寺
量子位 | 公众号 QbitAI
AI圈卷到现在，开始建工厂了。
这不，就在刚刚，北京就开了一家，包含两个核心组成部分：
一个是训练工厂：
目标算力规模10万P，负责把通用大模型、行业数据和算力资源放进来，炼成金融、制造、政务、科研等行业能用的专业模型。
另一个是Token工厂：
目标日均产能10万亿Token，负责把这些专业模型封装成企业可以调用、可以计量、可以结算、可以稳定交付的专业Token。

这便是九章云极在2026全球智算科技峰会暨九章云极战略发布会上，正式抛出一个新战略——AI工厂。
它听起来点像把AI产业搬进现代化工厂：前端炼模型，后端送智能。
然后中间再用DCU（1度算力）度量算力投入，用专业Token（面向业务任务的智能价值单元）度量智能产出，再让业务数据回流，继续推动模型迭代。
由此带来的效益，用一组数据展示便是：
10万P目标算力规模、10万亿目标Token日均产能、1000倍目标综合降本、计划孵化1000个高价值模型与智能应用。
更直观的，一张图解如下所示：

不过比起这些数字来说，从九章云极的这次战略发布来看，智算云的商业逻辑正在发生变化——
它不再只回答算力够不够，还要回答算力能不能变成真正可交付的智能。
而这，便是九章云极此次动作的目的，把这上面个问题试图工程化。
AI工厂，到底怎么运转？
要理解这座AI工厂，我们首先需要了解当前企业在拥抱大模型时面临的真实痛点。
过去，大家热衷于讨论的可能是模型参数有多大、是不是开源、打分高不高；但现在，业务一线的真实拷问是：
模型能不能真正跑进我们复杂的业务系统？在超高并发下，能不能稳定输出可预期的结果？每一次API调用的成本，业务部门能不能算清账、算赢账？
这已经不是一个纯粹的算法竞赛，更准确的说，应该是一个典型的工程与工业化问题。
毕竟阻碍AI落地的现实瓶颈往往不在大模型本身，而在其背后的整套底层智算基建，包括算力调度是否高效、异构算力能否统一纳管、推理成本是否足够低、任务失败时系统能否自动感知并自愈……
因此，九章云极推出的AI工厂，本质上是在用一套标准化、规模化、高可靠性的工业化流水线，去重构智能的生产与交付体系。
从AI工厂的整个版图来看，可以分为四个关键部分来看。
投入侧：首创“一度算力”（DCU）
这是解决如何购买算力的问题。
长期以来，算力行业最大的痛点就是资源不标准、计价不透明、投入不可量化。
过去，企业通常需要去租用GPU、规划网络拓扑、考虑存储带宽以及机器的使用时长。
这种粗放的租赁模式，就如同在初期的电力时代，想要用电，必须自己去买煤炭、租发电机，甚至自己去拉电线，门槛极高、成本混乱、无法规模化。
九章云极在行业内首创了“一度算力”计量单位，将其定义为312TFlops×小时（每秒钟312万亿次浮点计算乘以一小时）。

△九章云极董事长，方磊
它将底层芯片（异构的GPU、NPU）、网络、存储、使用时长及实际利用率等极其复杂的物理资源统一折算计量。
对客户而言，算力采购从此变得像买电一样简单，按“度”付费、所见即所得。

生产侧：训练工厂
训练工厂解决的是智能“从0到1”的生产问题。
通俗来讲，就是把通用模型、行业数据、算力资源放进来，通过数据处理、领域精调、强化学习、评测反馈等流程，训练出金融、制造、政务、科研等场景可用的专业模型。
这里的重点不只是有多少卡。
训练工厂强调的是千卡到万卡级集群、高密度网络存储、故障自愈、跨地域调度，以及从数据、训练、评测到部署的全流程工具链。训练工厂能够将通用基础模型，升级为适配各行各业的专业任务模型。
通用模型存在天然的数据边界与能力边界，无法覆盖企业私有数据、行业Know-How、复杂业务流程。而训练工厂的价值，就是把行业专属知识沉淀进模型，让AI从会聊天、会答题，升级为能拆解任务、能自主决策、能风险判断、能闭环落地的产业智能体，真正适配企业生产环境。

封装侧：Token工厂
Token工厂解决的是智能“从1到N”的交付问题。
训练工厂生产出专业模型之后，模型本身还不是企业能直接消费的商品。企业真正需要的是稳定API、SDK、权限体系、模型版本管理、监控告警、计量计费和服务保障。
Token工厂就是把训练工厂产出的专业模型，封装成可调用、可计量、可运营的专业Token。
这里的Token，也不只是大模型里的技术计数单位。按照九章云极的定义，专业Token更接近一种面向业务任务的智能价值单元。不同任务、不同模型、不同服务等级，都可以通过Token被计量和结算。

产出侧：越用越强，越强越便宜
至此，AI工厂的核心飞轮闭环就此形成：
DCU度量投入 → 训练工厂冶炼专业模型 → Token工厂转化为专业Token → 企业消费Token并回流业务数据 → 模型持续迭代
我们可以把它理解为“越用越强，越强越便宜”的增强回路。在这里，数据不仅是原料，也是模型进化的养分。

值得注意的是，在这一闭环中，九章云极重新定义了Token。
他们认为，面向消费者的泛化Token单价已经由于市场竞争趋于零，其价值正逐渐见顶。而面向产业的、具有明确 ROI（投资回报率）的专业Token，才是驱动产业智能化的核心组件。
九章云极将这些专业Token进行了清晰的价值分层，并将其战略重心聚焦在后两者：
消费级Token：主要服务于日常AI应用、内容创作，追求极致体验与规模普惠，如同稳定经济的基础电力；专业级Token：封装了行业深度Know-How与私有数据，充当金融风控、质量检测、政务服务的数字专家，保障流程安全、合规，让客户买到确定的效率与风控价值；前沿级Token：面向复杂任务自动化与科研突破。例如，封装了多步骤、多工具的端到端仿真或科研工作流，直接服务于药物发现、新材料研发、城市级系统优化等曾经不可解或成本极高的科学边界。

从租卡到用Token，企业AI开始变轻了
过去企业做AI，往往是一条漫长的重资产建设路径。
包括多方协调、艰难地在市面上找芯片、拼凑卡；组建专业的集群运维团队，解决算力中断、故障恢复；搭建复杂的开发与模型训练环境，再进行私有化部署。
这一套流程下来，周期通常长达6到12个月，还没看到业务效果，前期资本开支已经堆成了天文数字。
而在九章云极AI工厂的模式下，针对不同类型的市场玩家，整个接入路径被彻底变轻、变薄。
针对大模型公司和垂类AI企业：从训练开始
大模型创业公司或者垂直行业的AI领头羊，自身拥有极强的算法和数据能力，但往往被算力运维和成本压得喘不过气。
对于这类客户，他们可以从训练工厂无缝切入。AI工厂提供千卡到万卡级的极致弹性算力集群，不仅保证大规模模型并行训练的高效运行，还提供跨地域调度和故障自愈的底座。
当模型在训练工厂中训练、精调、评测完毕后，客户无需再折腾复杂的转转运环境，可以直接在云端一键Token化分发至Token工厂。
AI工厂可以说是帮这类企业打通了从研发到商业化上线的这条路，让算法科学家能够将100%的精力聚焦于模型本身。
针对行业客户和SaaS公司：从推理开始
对于绝大多数金融、制造、政务领域的实体企业和SaaS开发商，他们未必有必要训练自己底层的基座大模型。他们更现实、更迫切的需求，是在现有的客服、风控、质检或办公系统中，引入成熟好用的行业专业智能。
对他们而言，Token工厂提供了一条极轻的消费型路径：不用买卡、不用建集群、不用招募昂贵的底层运维团队。
平台上已经预置了50多款主流基座模型以及多款面向金融、制造、政务、科研等真实场景精调完毕的模型，这些模型和能力均已就绪。
企业可以直接调用已经封装好的Token服务，按需消费、按量付费，将沉重的基建投资转变为灵活的运营支出。
过去需要大半年的项目建设周期，现在如果从调用专业Token切入，最快只需两周左右即可完成业务概念验证。
针对开发者和AI Agent：还有专属入口
针对开发者、科研人员与AI Agent场景，九章智算云打造轻量化算力入口，解决本地算力不足、云端环境繁琐、远程调试卡顿等行业痛点。
对于AI工程师而言，头疼的日常莫过于代码在本地，算力在云端。为了解决远程SSH卡顿、环境同步繁琐的痛点，九章智算云已经上线了IDE插件。
现在，开发者可以在VS Code、Cursor等常用本地编辑器中，实现直连云端GPU。开发人员在本地写下代码，算力直接在云端跑实验，并且能够根据任务自动开启和关闭，不用不计费。
同时，九章智算云还将陆续推出CLI、SDK以及Skills Hub。无需理解底层复杂的硬件拓扑，使用时通过简单的交互即可提交并运行任务使用算力。
与此同时，九章云极在发布会上同步启动智算开放计划，面向全球开发者、科研团队和高校用户开放普惠算力，消除创意与智能落地的阻碍。
算力战，现在拼的是卖生产力
从行业视角来看，九章云极这次发布AI工厂，踩中的是智算云市场正在发生的一次转向。
早期，市场拼的是有没有卡。大模型爆发后，算力短缺是硬约束，谁能提供更多GPU，谁就更有话语权。
随后，竞争开始转向能不能用好卡。算力规模上来后，GPU利用率、训练稳定性、跨地域调度、推理成本、异构硬件管理，都会直接影响有效算力。
现在，企业更关心的是第三件事，也就是能不能把算力真正交付成业务结果。
算力是投入，模型是中间产物，Token是产出，业务效果才是最终价值。这也是AI工厂概念最核心的变化：九章云极没有把自己只放在算力供应商的位置上，而是试图成为智能生产力的组织者和交付者。
它的思路可以理解为用DCU定义算力投入，用训练工厂生产专业模型，用Token工厂建设智能交付网络，最终把智能能力送到企业和开发者手里。

当然，智算云市场不缺宏大概念，最终还要看真实交付。客户会追问的，仍然是几个具体问题：接入是否简单？成本是否真的下降？服务是否稳定？账单是否透明？业务效果是否可验证？
尤其是1000倍综合降本这样的目标，足够吸睛，也需要在更多场景里被持续验证。它背后依赖的，不只是硬件堆叠，而是全栈自研OS、算电协同、全局调度，以及围绕训练和推理的系统级优化。
这也是AI基础设施真正拉开差距的地方。
长期来看，模型会继续迭代，硬件会继续更新，价格也会波动。真正稀缺的，是把算力、模型、Token和业务价值串起来的工程系统。
九章云极这次提出AI工厂，意义正在于此。把智算云的竞争，从谁有更多算力，推向谁能更稳定、更低成本、更规模化地交付智能。
AI圈开工厂了。
接下来要看的，是这座工厂能不能真的开足马力。

免责声明：本网信息来自于互联网，目的在于传递更多信息，并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益，请及时联系我们，本站将会在24小时内处理完毕。

同类资讯

活力中国调研行｜天津商业航天重点“小巨人”：年轻科研人才是最大优势

刚刚，北京建了一座AI工厂：目标10万P算力，日产10万亿Token！

2028 年的高端 iPhone 机型会从 2 纳米转向 1.4 纳米芯片

明年推出的 iPhone 20 周年纪念版机型可能有两种尺寸

戴尔新XPS 13笔记本来了，学生价仅599美元

9390万元！智谱拿下大模型大单

全站最新

活力中国调研行｜天津商业航天重点“小巨人”：年轻科研人才是最大优势

刚刚，北京建了一座AI工厂：目标10万P算力，日产10万亿Token！

2028 年的高端 iPhone 机型会从 2 纳米转向 1.4 纳米芯片

明年推出的 iPhone 20 周年纪念版机型可能有两种尺寸

热门推荐

活力中国调研行｜天津商业航天重点“小巨人”：年轻科研人才是最大优势

刚刚，北京建了一座AI工厂：目标10万P算力，日产10万亿Token！

2028 年的高端 iPhone 机型会从 2 纳米转向 1.4 纳米芯片

明年推出的 iPhone 20 周年纪念版机型可能有两种尺寸

戴尔新XPS 13笔记本来了，学生价仅599美元

9390万元！智谱拿下大模型大单

AI产业竞争内核迭代九章云极发布“AI工厂”战略

一天涨出一个巴菲特！AI加持，马斯克身家涨到飞起

微软正式发布新的智能体工具！按量计费，核心动因是AI算力成本大幅攀升

摩尔线程推出AI Coding Plan智能编程服务

全国首个 “脑机接口×医保场景”国家级大赛落地杭州 8大赛道全景揭秘

美货运“龙”飞船携科研样品返回地球

华为申请“世界”商标，核定使用的商品含汽车

439.7公里：理想L8城区纯电续航出炉，平均电耗14.9千瓦时/百公里

星海图联合北京亦庄共建数据公司“亦数智能”

首页

资讯

财经号

智能车

专题

电商资讯

人物资讯

滚动资讯

首页

新科技

新金融

新零售

智能车

房地产

科技探索

人物资讯

网络游戏

人工智能

专题

刚刚，北京建了一座AI工厂：目标10万P算力，日产10万亿Token！

AI工厂，到底怎么运转？

从租卡到用Token，企业AI开始变轻了

算力战，现在拼的是卖生产力