
![]()
“CUDA之后,算力生态有没有反超机会?”
作者丨赵之齐
编辑丨包永刚
在国产算力赛道里,硬件强、软件弱,已是集体性的难题。
作为龙芯、海光CPU的创始人,唐志敏深耕国产芯片领域二十年,当下,他把目光更坚定地投向“软件”一侧。他直言:芯片问题的根本,不在硬件,而在软件。
在与雷峰网的对谈中,他把国产芯片难以起势的矛头直接指向行业里敏感的一环——底层软件接口与指令系统的混乱。他认为,国内芯片表面上“百花齐放”,背后却是整个社会为兼容性付出高昂的隐性成本;真正决定未来算力格局的,并不只是哪家硬件的性能领先,而是谁能够让其上的软件真正复用、真正跑起来。
他举了几个如今行业里颇具荒诞感的案例:在国内创业公司还在“是否要兼容CUDA”的十字路口徘徊时,有人试图在国内做“CUDA兼容性测试标准”;还有人把“模拟电路”视为数字芯片发展的瓶颈,却忘了数字与模拟本就是实现电路的两种基本路径。
这些荒诞,也有一部分源于国内产业人才缺乏软件思维、“高不成低不就”。在这次对谈中,唐志敏围绕指令系统、底层软件接口、人才培养等关键议题展开剖析,试图为国产算力指出更深层的“底座问题”。
从牵头研制国内首款通用CPU“龙芯一号”,到带领海光取得AMD x86授权,唐志敏推动着国产通用服务器CPU体系破局;从曙光、海光到象帝先,他也主导了CPU与GPU的研发,并探索新型体系结构的边界。如今,他扎根深圳理工大学,推动算力微电子的人才培养与前沿攻关。
当国产算力逐渐走到历史的舞台中间,这位领域深耕的领军者,对此又有什么新思考?在雷峰网GAIR全球人工智能与机器人大会《AI算力新十年》论坛上,这位横跨学界与产业界、推动中国高性能处理器与体系结构持续演进的重要实践者将现场拆解国产算力架构的破局路径与未来演进。
在此之前,雷峰网与唐志敏进行了一场对谈,围绕国产算力的核心瓶颈、人才培养体系等产业根基问题。这份对话实录,是对大会核心议题的前瞻解码,12月13日,雷峰网GAIR全球人工智能与机器人大会《算力新十年》论坛现场,诚邀您见证这场关于中国算力未来的巅峰论道。
![]()
唐志敏
雷峰网:您来到深理工任职,现在主要的研究方向是什么?
唐志敏:我现在的研究还是以新一代算力芯片为主。一方面,是怎么把传统的CPU、GPU和AI处理结合在一起;另一方面是密态数据处理,就是在明文的数据处理之外,让数据在加密的状态下被计算,这样能解决现在数据要素流通里头碰到的各种问题。
雷峰网:您之前参与过CPU、 GPU的开发,感觉现在这些芯片未来想取得比较大突破,可能比较关键的点会在哪里?
唐志敏:关键还是解决软件的问题。
相比各种软件和应用的开发,芯片开发不是最大头、最难的,最难的是要把软件能真正部署起来、用起来。表面上看,做硬件和芯片好像挺花钱,但这是因为软件分散到很多不同公司在做,这些软件的开发成本、人力、费用和时间其实都比硬件的多。
现在每家做出来的芯片都不一样,实际上软件开发的成本就会越来越大,是社会资源的浪费。所以我一直在说,芯片可以有自己不同的架构,但是对软件的接口应该是一样的,这样全社会的软件就可以重用。
雷峰网:但这会不会是一个比较美好的想象?因为感觉在商业界比较难实现。
唐志敏:对,实现这一点有两种可能,一种就是主动的,我们呼吁大家一起搞个联盟;另一种就是更残酷的商业技术的收敛,就像CPU收敛到x86架构那样。选择主动的方式,可能就会有更多样化的、美好的世界。
雷峰网:主动的话,可能是谁牵头做这件事?
唐志敏:国家产业主管部门牵头吧,让商业公司都参与其中,本来就是产业共性的东西。前两天我才收到邮件说,有关部门或团体要搞个CUDA兼容性的认证测试标准,这是我们中国人该干的事吗?你说这不是贻笑大方吗?
雷峰网:要不要做CUDA兼容,也是国内大家创业一直有争议的地方。但具体来说,在软件生态建设的这么多层里,什么事情是最难的?
唐志敏:底层硬件API层面、指令系统等层面上的统一,可能是最关键的。
雷峰网:这种统一会让底层硬件缺少差异化吗?
唐志敏:不会,指令系统本身没有太多创新的东西,主要都是指令系统下面的架构、或上面的软件有创新,指令系统本身无所谓的,就像语言。一种语言真的会比另一种语言好多少吗?不一定,重要的是用这种语言写出来的文章有多好。也不用因此担心会失去差异化,同样一个Arm,苹果做得就是比别人的好。
雷峰网:看您的公开发言,您更多是主导RISC-V这一套是吗?
唐志敏:我觉得RISC-V是个好的平台,比较开放,大家如果有新的想法,也可以往里加几条自己特有的指令。而且在这个平台上能做普通的CPU功能,也能做AI加速功能。
雷峰网:但现在RISC-V比较多是在MCU(微控制单元),如果想往高端一点的领域,比如服务器之类的去拓展,它的主要突破点会在哪里?
唐志敏:软件。国外现在有好几家公司、国内也有人陆续在做面向数据中心或服务器应用的RISC-V芯片,但软件问题没有太好解决,所以应用打不开。MCU软件很简单,把嵌入式的SSD(固态硬盘)几个程序做好,就能用了。
如果应用比较确定,针对这个领域的软件去做也相对比较容易,但服务器应用里,确定场景的量都不大,所以芯片公司很累,基本就是要做什么都通用的才行。 现在国内阿里云这些做公有云的,主要都是用英特尔的CPU,同架构的AMD用的都不多,就是因为英特尔兼容性最好。唯一的一家,只有亚马逊开始用自己的Arm架构CPU,可能也是他们有一部分客户的应用都比较能搞得定了。
雷峰网:但大家会有什么动力去替换成RISC-V呢?毕竟英特尔的东西其实不需要再花人力,只要芯片硬件成本而已。
唐志敏:现在能想象到的还是国际形势的推动。但我觉得好多手机厂商自研芯片都不一定有价值,除非像苹果一样,用了之后能显著提升技术壁垒;而且苹果价格高,利润空间大,就能支撑。
现在国外RISC-V发展也不太好,每年开RISC-V峰会就有很多国外公司来,想把他们的技术拿到中国市场,我们可以利用这个机会整合RISC-V的国内外资源、人才集中到这个平台上来。
雷峰网:感觉会带来一个更难解决的问题,就是底层的硬件越复杂,上层软件的复杂性可能增加的会更多,所以对于上层的软件的要求挑战也越大。
唐志敏:是,所以基于RISC-V这一个平台开发,大家互相借鉴、能复用的东西才会多很多。
雷峰网:历史上我们有过这样的经验吗?
唐志敏:x86,那是市场竞争形成的格局。目前为止大部分为计算机和服务器开发的软件,都是针对英特尔x86来优化,这就是一个很好的例子。
雷峰网:但这样是不是意味着我们如果要去切换到另一套底座上,代价很大?就像现在国内信创市场里大家比较认C86/x86一套,因为生态比较成熟,Arm也很难做进来。
唐志敏:之所以这样,就是现在我们产业里真正软件相关的开发能力比较弱,x86生态就可以用已有的软件。如果软件是自己开发的,就算痛苦一点也能迁移过去。
雷峰网:是的,很多做软件的人都会说国内没有软件业,大家也不信任软件的价值,很多都是从开源社区拿过来后改改就能用。
唐志敏:看起来大家很重视,很多年前软件工程就是一级学科了、各个大学都有软件学院,软件企业还有政策优惠,但事实上还是不重视——知识产权不被尊重,导致软件就变成不值钱的东西。做硬件至少有个好处,就是复制起来有成本有门槛。
所以想从这里破局,在教育上也要加强。现在教育体系里培养的人才很多都是高不成低不就的,学集成电路的毕业生不会做CPU,他们只能做点小的器件和电路,计算机学院培养出来的人只会写应用软件,更底下的内容他们也不明白。
雷峰网:所以过去这块的人才培养存在什么明显问题吗?
唐志敏:比如我们培养底层软件的人才,像操作系统和编译系统,虽然大学里学计算机都要学这两门课,但很多讲课老师其实都不太懂。
而且前两天有个国际集成电路方面的圆桌论坛,主题是说现在模拟电路成了数字芯片发展的瓶颈,问我怎么看?我说数字和模拟本来就是实现电路的两个基本手段,我们不要人为地把它分开。我们的教育把什么东西都分得太细了,本来是相邻的两件事之间划出一条巨大的鸿沟。发达国家的大学,电子工程和计算机专业都在一个系里,而中国就是分得很开,不光不在一个系、甚至不在一个学院。
雷峰网:那您的产业界视角,会给现在的学术教育工作带来什么新的视野?
唐志敏:现在我对于学生应该具备什么能力看法会不一样。我们是用项目制去培养学生,会给学生提供和产业界基本一样的实验环境,在教学中以芯片和CPU为主,CPU这边都是教的RISC-V,让学生学会设计CPU,在CPU上把操作系统跑起来。但现在学生和十几年前比起来还是挺不一样的,他们很现实,就会看这个课有什么用、学的东西对自己有什么帮助。
雷峰网:您之前的职业生涯在做的事情主要都和硬件相关,那为何一直强调“软件是最重要的”这个结论呢?
唐志敏:我最早做CPU的时候就意识到,很难搞定很多复杂的软件,所以兼容性非常重要。英特尔听起来也是个CPU硬件公司,但他们的软件工程师比硬件工程师多。对芯片公司来说,软件实际上是命根子。国内有的芯片大厂,会为了一个项目花200多个人驻场帮用户优化适配软件。
雷峰网:是在工作中才感受到软件的重要性吗?
唐志敏:我们学计算机的人一开始就知道了。体系结构的第一堂课,就要讲“体系结构是什么”,就是硬件和软件的界面、其实就是“指令系统”,我们做体系结构要管的事情就是:一个计算机系统里,什么工作由硬件来做、什么工作由软件来做。
大家现在很多人在说“软件定义某某某”,如软件定义存储、软件定义网络、软件定义无线电等等,但我们学计算机的人从来不说“软件定义计算机”,因为软件就是计算机最本质不可分割的东西。
雷峰网:国内很多芯片公司一开始都很难意识到软件很重要。
唐志敏:因为芯片公司里的人大部分是学电子工程出身的,他们更多专注于器件和电路本身,不理解软件。一些小芯片没有什么软件,做完也能用,但你做个GPU,上层就还有一堆复杂的东西等着解决、才能用起来。
雷峰网:那这样对国内的GPU公司来说是不是就更难了,大家未来的机会在哪里?
唐志敏:对大家来说未来有个机会就是大模型收敛,如果市场上只剩下ChatGPT或DeepSeek,那我们只要把这两个对接做好就行了。
作者长期关注半导体、算力上下游等方向,欢迎添加作者微信Ericazhao23交流。
第八届 GAIR 全球人工智能与机器人大会
2025年12月12-13日,第八届GAIR全球人工智能与机器人大会,将在深圳南山·博林天瑞喜来登酒店举办。
今年大会,将开设三个主题论坛,聚焦大模型、算力变革、世界模型等多个议题,描绘AI最前沿的探索群像,折射学界与产业界共建的智能未来。
目前,诸多重磅大咖名单正式揭晓,还有更多行业领军者将齐聚现场,共探智能的未来。欢迎点击文末“阅读原文”或识别海报二维码,报名参会,相约 GAIR 2025 ~
![]()
报名参会:扫海报底部二维码↑↑↑






京公网安备 11011402013531号