当前位置: 首页 » 资讯 » 新科技 » 正文

原生行业大模型怎么建?南网给出了一个样板

IP属地 中国·北京 编辑:朱天宇 AIE加速工业进化 时间:2026-02-06 18:14:22

大语言模型出现以来,各行业构建自身专属大模型就成了热门方向,各大央国企几乎人手一个行业大模型。然而,仅通过垂直场景数据微调构建的行业大模型并不能真正从底层掌握行业知识,算不上真正的行业大模型。

要实现真正掌握行业知识的行业原生大模型,创新的底层模型结构预训练是不可避免的,这是一条投入巨大且短期成效不明显的路径,愿意尝试的企业不多。

25年底,南网发布了原生电力大模型AI EPS V1.0,从介绍看,这是一个从底层结构出发训练出的原生行业模型,其开发过程或可以为很多其它行业提供参考。本文这里对它做个简要介绍,更完整的PPT内容参见 “阅读原文”。

何谓“原生”?

当前的行业大模型建设路径,最常见的是多模态模型结合专属数据微调而来,一般都是面向特定细分场景建设,也可以通过一些技术手段(如Lora微调)在一个模型中融合多个场景,但是模型并不掌握更多的、更广泛的行业知识。

构建行业知识库+RAG也可以构建行业模型,但是RAG只能提供检索,并不能将知识库隐含的知识嵌入成为模型固有知识参与推理。Agentic RAG针对知识库构建知识图谱,一定程度上可以使模型基于知识图谱进行推理,但是成本偏高,仍有待改善,当前应用也不多。

此外,不少企业建设的行业大模型,其实是一些面向特定场景(如原料配比优化、工艺控制参数优化等)的模型,可能仍是原来的传统AI小模型(或其参数增大版),不属于当前大模型的技术路线,也不广泛掌握行业知识和推理能力。

以上方法都无法构建真正掌握行业知识的行业大模型,即并非“原生”行业大模型。

要构建真正掌握行业知识的“原生”大模型,显然需要在模型的训练阶段就结合行业知识进行预训练。

但这并不够。由于当前的大模型能处理的基础数据结构主要是文本和像素化图像,而很多行业知识由更复杂的数据结构表示(如 时序数据,各种拓扑图,CAD几何文件(让AI理解CAD模型怎么这么难)等),只有在模型底层动手,使模型原生能够处理行业数据结构才能通往真正原生行业大模型。

南网原生电力大模型AI EPS

2025年12月,南网发布了与怀柔实验室联合研发的首个NWHR电力原生大模型AI EPS V1.0,据称是世界上首个从底层架构源头创新的原生电力专业大模型,按照电力系统特性打造,重点解决大模型能否真正理解电网、能否用于实际调度的核心问题。

底层架构创新

之所以称为原生,在于模型满足前面提到的:一是在底层架构方面通过多种技术手段,使得模型满足理解并遵循电力运行准则和物理规律,二是基于电网实际测量数据进行了训练。

模型具体开展的工作包括:

将电网拓扑、量测状态和运行约束统一建模为结构化图空间,实现数值、函数和文本在电力非欧空间的对齐。(简单理解:模型能真正看懂电力拓扑图)

将电网物理定律(通过PINN物理信息神经网络模型,CAE领域创建AI代理模型较为常见)和电网运行规章制度(预训练)嵌入模型,使模型满足电网运行规律。

研发语义对齐模块,解决多类调度业务之间数据和语义不统一问题。即模型能够理解电力术语和规范。

循序渐进,从模拟数据到最后使用实际实时电网测量数据训练模型,模型结果与真实电网对齐。

取得的初步成效

发布时,模型在云南大理电网进行了实际验证,在新能源出力快速变化场景下,AI EPS V1.0能够提前进行系统状态推演,快速生成运行方式调整建议,将调度方案生成时间由传统的数小时缩短至数分钟,在保障安全的前提下显著提高新能源电力消纳水平。

不过AI EPS 1.0还只是在地市级电网开了个头,AI EPS 后续还将进一步深化和拓展到省级电网以及区域级电网的运行调度中。

AI EPS在构建行业大模型方向上迈出了一大步,其技术思路值得更多行业参考,但投入门槛之高也决定了只有极少数企业有可能跟进,如光算力设施一项,南网目前已达到近800P,未来将达到3000P(南方电网的AI应用情况梳理)。

从某种意义上说,AI EPS就是为电网运行创建的一个大的CAE仿真模型,因此其技术思路与CAE 仿真代理模型的构建有一些类似(如PINN的应用)。AIE正在连载的专题对于当前AI仿真各种方向有进一步的介绍,。

目前已发布相关文章:

国家电网及南方电网AI应用情况分析与总结

物理AI到底在说什么,跟具身智能、数字孪生、世界模型、AI CAE啥关系?

CAE各方向软件国内外厂商产品对标一图总览

免责声明:本网信息来自于互联网,目的在于传递更多信息,并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益,请及时联系我们,本站将会在24小时内处理完毕。