当前位置: 首页 » 资讯 » 新科技 » 正文

通用Agent是伪命题?昆仑万维方汉现场拆解:垂直推理才是胜负手|新智元十年峰会

IP属地 中国·北京 编辑:任飞扬 新智元 时间:2025-09-11 20:27:11


新智元报道

编辑:编辑部

在新智元十周年峰会上,昆仑万维董事长兼CEO方汉分享了企业三年四代「天工」的演进故事。从音乐、视频到智能体,昆仑万维在AIGC与AGI浪潮中不断突破,实现了从互联网平台到AI原生公司的转型。昆仑万维凭借全球化布局与持续创新,正在勾勒「破界·融合·共生」的未来愿景。

通用人工智能(AGI)无疑是科技界最令人向往的理想之一,它代表着人类智慧的极致想象。

这个愿景令所有人心驰神往,遗憾的是,暂时我们还难以触碰。

与之相比,人工智能生成内容(AIGC)像流星般划破夜空惊艳了所有人。

现在每个人都可以使用AI生成作品!

当下,用AIGC来生成文字、图片、音乐、影视等作品已经成为时代浪潮!

不论是年初ChatGPT引发的吉卜力热潮,还是谷歌nano banana发布后的香蕉革命,都证明一件事:

每个人都有一颗渴望表达的心。


有机构统计,AIGC市场规模在2023年达到16亿美元,预计到2030年将增长至187亿美元。

2024-2030年预测期间的复合年增长率高达25.39%!


Global Market Insights报告,AIGC市场预计从2025年的297亿美元增长,2024年已达270亿美元,年复合增长率为11.6%


在这股浪潮中,国内外公司纷纷布局,但有一家中国公司提前就洞察到AIGC的潮流趋势。

在多模态领域不断创新,推出AI智能助手、AI视频、AI音乐与音频、AI游戏、AI社交等的产品矩阵。

在「新智元十周年峰会」上,昆仑万维董事长兼CEO方汉登台,以「破界·融合·共生」为题,分享了昆仑万维如何在全球AI浪潮中完成转型,走向AGI产业实践。


2025年,新智元也一同见证了昆仑万维AI产品的迭代和升级爆发之路。

让打工人沸腾的AI版Office,天工超级智能体(Skywork Super Agents),我们进行了全面实测,从此键盘鼠标彻底退休!


对标李飞飞的World Labs,中国自研的世界模型Matrix-3D,只需单张图就能生成可自由探索的3D世界!


还有中国首个开源的AI短剧模型SkyReels-V1,也出自昆仑万维之手,可以4090(单台显卡80秒)秒生好莱坞级大片!


以上并不是全部,还有很多的产品和模型。

在AI技术浪潮席卷全球的今天,如何将前沿的大模型技术转化为具备商业价值的落地应用,是所有从业者面临的核心课题。

昆仑万维董事长兼CEO方汉先生在峰会上回顾公司发展历程:

昆仑万维在长达17年的发展过程中一直在努力求新求变,不断寻找第二曲线,也不断进行高速转型。

在此基础上,他进一步分享了对多模态AGI产业化的独到见解。


他认为,通用Agent并非万能解,垂类行业的深度推理数据是构筑技术壁垒的关键。

同时,他提出了AI商业落地的核心逻辑:toB在于「增效」,而toC的根本在于「降本」。

方汉还提到一个有趣的观点,情感陪伴这种看似小众的需求,反而是最接近C端用户的真实痛点,这方面的token消耗仅次于编程的需求。

在探索中发现机会

昆仑万维是一家典型的中国互联网企业,17年来不断求新求变、勇于自我转型。

公司成立早期主要在海外实现增长,之后进军网络游戏并成功上市,再到布局互联网平台。

而从2022年起,公司坚定转向AGI与AIGC业务,逐步形成了「三驾马车」:

AGI与AIGC业务(核心增长引擎)

信息分发与元宇宙业务(以Opera浏览器为代表)

投资业务


早在2022年12月,昆仑万维就发布了国内首个开源13B中文预训练大模型,走在行业前列。

事实上,自2020年起,公司便果断押注AI,开启了音乐大模型研发。

如今,音乐模型已成为昆仑万维技术最强、成果最显著的方向之一。

可在当时,创始团队同样面临十字路口:

转型互联网平台五六年,取得了一些成绩,下面该选择什么方向?

当时摆在面前的有四条赛道:Web 3.0、元宇宙、VR、AI。

就在GPT-3带来震动之时,他们押下了那一注。方汉回忆:

当时我们并不知道什么是AGI,但我们相信,GPT-3给我们带来了方向,AIGC会大行其道。

事实印证了选择的正确。

这一步,不仅改变了昆仑万维的未来,也让它在AI浪潮中站上了前排。

昆仑万维的成长轨迹,几乎就是中国互联网企业的缩影。

2008年成立,2015年登陆深交所,公司一度凭借页游、手游出海打开全球市场,业务已覆盖100+ 国家与地区、全球月活近 4 亿;

2025年上半年营收37亿元,海外占比92%。

在发展的前十余年里,昆仑万维经历了三次关键转折:


真正的转折点,发生在2022年。

全球AI浪潮骤起之时,昆仑万维果断All in AI——从开源中文预训练模型起步,迅速延展到音乐、视频、搜索与智能体。

多模态推理、生成与应用「三线并进」,公司由互联网平台型企业,加速跃迁为AI原生公司。

如果说转型是方向,那产品就是验证方向的最好证据。方汉直言:

昆仑万维在AI上的投入是从2020年开始的,最初的探索就是音乐大模型。

三年时间,昆仑万维在语言、音乐、视频、智能体等多模态领域全面开花。



昆仑万维AGI发展里程碑

多模态产品矩阵的持续突破

起点|天工大模型:从1.0 到4.0

天工系列是昆仑万维进入大模型赛道的起点。

2023年,天工1.0发布,成为中国首个对标ChatGPT的双千亿级语言模型;

2024年,天工2.0和3.0相继上线,采用混合专家架构拉开差距;

2025年,4.0进化为多模态,面向C端免费开放,实时语音对话更顺畅。

年四代,主线清晰——以「用」促「研」,把大模型带到更多人手边。


Skywork Super Agents:8小时缩短到8分钟

演讲中,方汉花了最多时间介绍的,是Skywork Super Agents。

这款产品切入的,正是所有人都离不开的办公场景。

传统的office产品:Word、Excel、PPT用起来割裂,来回切换,既耗时又低效。

哪怕是微软、Office、谷歌Workspace这样的全球产品,也没能真正解决这个问题。

方汉一针见血地指出:

80%的办公时间耗在Office。一个大会PPT,动辄2万—10万才能做出专业水准。

过去的AI办公助手,也只是给出一些模糊的建议,真正落地还得由人进行二次加工。

Super Agents想要解决的,就是这种低效。


它走的是一条完全不同的路——不是「问你想做什么」,而是「你最终要什么?」

这个过程是可以追溯的,为的就是确保产品完全不会出现幻觉,显著降低「胡说」风险。

就这样一步步对齐目标;后一口气交付文档、表格、PPT、播客,甚至视频。

过去几天的工作量,如今几分钟就可以交付。


Skywork Super Agents我们做过非常详细的测评,完全就是想象中「智能体」的样子!

首先是支持的模式非常多,几乎涵盖了「打工人」日常能够想到和用到的所有场景。

而且其中有几个场景运行起来真的是那种「科幻般」的效果!

你懂吗,就是钢铁侠和贾维斯互动那种感觉。


方汉现场还分享了一个券商用户的故事:

刚毕业三年之内的初级研究员应该不可能做得比我们这个产品更好。

只有高级研究员才能做得比我们更好,应该来说我们满足了很多用户的刚需。

自5月发布以来,一周内社交媒体话题阅读量破3.5 亿;上线首日因访问量过大限流,一度登顶GAIA榜单全球第一。


它不仅是一款爆款,更成为昆仑万维全球化战略的重要支柱。

艺术与娱乐:Mureka与SkyReels

音乐大模型是昆仑万维最早的布局,也是最具代表性的成果。

2025年3月,Mureka 01发布全球首款音乐「推理」大模型,在指标上对标并超越Suno;

升级至V7.5后,在中文歌曲的音色、演奏技法以及咬字、发言、情感体现上都已经是目前最好的模型。

方汉表示:

昆仑万维的AI音乐模型MurekaV7.5,可以Suno可以相提并论。

如今,从歌词、旋律到演唱、MV,全都能由Mureka一键生成,真正做到了AI「音乐生产一条龙」。

视频方向的代表作品是SkyReels。

2025年2月发布的V1,是国内首个面向短剧创作的生成模型,同年4月迭代到V2。

一张照片 + 一段语音 = 会说话的短剧镜头;还能改台词仍口型自然。

8月A3进一步升级!

方汉笑称说:

昆仑万维不光能驱动人,还能驱动物。

这句话让现场观众会心一笑。

8月升级版SkyReels-A3更进一步,数字人表演效果逼真,成为AI视频生成的一个标杆。

持续拓展的多模态拼图:Matrix与其他新品

另一大亮点,是Matrix系列世界模型。

首先是Matrix-Game2.0:支持实时交互视频的生成,表情动作符合物理逻辑,可用于虚拟游戏训练。

这一产品打通了从游戏自动生成训练数据的管道,从理论上来说可以把所有类型的游戏都变成虚拟世界。

Matrix-3D:能把一张图片和一句话扩展为可探索的3D世界。

Matrix给出另一条路:让AI直接生成可探索的虚拟世界。

除了重点产品,昆仑万维还在不断扩展多模态版图:

Skywork UniPic 2.0:整合生成、编辑与理解,首次引入渐进式双任务强化学习,在复杂指令下表现更稳定;


Skywork Deep Research Agent:打破传统搜索边界,不只检索文本,还能分析小红书、推特、Instagram上的多模态内容。

它们补齐了昆仑万维的多模态拼图,展现了构建完整生态的野心。

大模型落地应用的思考

方汉也分享了他对大模型落地的一些思考。

站在全球市场看趋势,才能更清晰地理解产业逻辑。

昆仑万维如今94%的收入来自海外,AI产品的落地同样以海外为主。

从Token的消耗看人类情感需求

方汉提到一个有趣的现象。

美国的OpenRouter作为大模型聚合API,对外统计过token的消耗情况。


结果显示,87%的token被用于代码相关任务,这个也印证了目前以Cursor为主的编程智能体是主流方向。

但排名第二的并不是大家以为的个人助理或市场营销,而是——情感聊天与角色扮演。

这背后说明了两个事实:

一方面,编程依旧是大模型最强的应用场景;另一方面,情感陪伴这种看似小众的需求,反而是最接近C端用户的真实痛点。

通用Agent解决所有问题是伪命题

方汉在介绍Agent时,提出一个有意思的观点:

通用Agent也许不能解决所有问题。

像过去的Windows+Office、安卓+GMS以及其它的所有行业软件都各有巨头。

从历史上来看,没有任何一家公司能够垄断所有方向。

一个通用Agent能解决所有问题吗?方汉认为非常有难度。

原因可以从目前token的消耗比例和大模型发布时喜欢「打榜」窥见一二。

现在不管是GPT-5,还是Grok 4,还是最新发的Claude 4.1,发布时的评测榜单以数学和编程榜单最多。

现在token消耗最多的是编程,那为什么大家都去打数学榜单?

难道所有人用大模型都是为了解数学题吗?

根本原因是,目前人类能够获得最好的数据其实还是代码和数学。

尤其在GPT-4o把CoT引入大模型之后,所有大模型要想能力提高,都需要非常好的、非常全的推理数据,也就是说有解题过程的数据。

而很令人幸运的是,由于GitHub大规模版本控制工具中心的出现,人类的代码有史以来过程数据最详尽,每次做代码提交都要写原因,都要写注释,代码质量是最高的。

而数学由于中国、印度的K12教育是全世界发展最好的,人类积累了将近2亿条K12教育的数据,尤其数学题的数据。

所以说,数学题也能解得很好。

反观其它领域的数据其实没有中间过程。

比如法院判决书会写理由,却不会告诉你法官的完整思考链条。

缺乏推理过程的数据,就很难支撑模型能力的跃升。

因此,在他看来,通用Agent不是最优解。

未来真正的突破口,在于各个垂直行业自己去积累和构建推理数据,才能像编程和数学一样,出现质变。

未来愿景:破界·融合·共生

在方汉看来,这些产业观察并不是和产品割裂的,而是共同勾勒出未来大模型发展的方向。

科研突破、产品迭代、产业落地,最终都要汇聚到一个更宏大的愿景:破界、融合、共生,就像昆仑万维的产品矩阵一样。


昆仑万维多模态AGI产业生态

昆仑万维在坚持「All in AGI & AIGC」 的同时,依托海外收入占比92%的先发优势,走出「先全球化、再本土化」的产业落地路径。

在演讲的最后,方汉用一句话点明了大模型落地的逻辑:

ToB是增效,ToC是降本,这是两个最基本的逻辑。

无论是Skywork Super Agents提升办公效率,还是Mureka、SkyReels让音乐与视频创作的门槛大幅降低,背后都对应着同一个趋势——

智能红利,正在以更低成本、更高效率,触达更多人。

站在十周年的新起点,新智元与昆仑万维一起回望过去十年的AI浪潮,更要展望未来的「破界·融合·共生」。

方汉强调的是:

AGI是一个理想;

但AIGC让每个人更好地表达自我,这是可以落地的。

这也是昆仑万维的愿景:实现通用人工智能,让每个人更好地塑造与表达自我。

今天,中国企业在AIGC领域迎来了特殊机遇。

一方面,受限于融资环境,许多企业被迫更专注于商业落地与盈利模式探索;另一方面,这种压力反而加速了中国厂商在AIGC赛道上的实践和创新。

正如「穷人的孩子早当家」,昆仑万维坚信中国企业必将在AIGC这一最接近C端用户、最具增长潜力的领域,实现突破和领先。

在破界、融合、共生的过程中,让我们共同见证并推动AGI产业的繁荣发展。

免责声明:本网信息来自于互联网,目的在于传递更多信息,并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益,请及时联系我们,本站将会在24小时内处理完毕。