当前位置: 首页 » 资讯 » 新科技 » 正文

全国产!北京AI大模型芯片流片

IP属地 中国·北京 编辑:周伟 芯东西 时间:2026-06-17 20:26:25

3D混合堆叠架构,16TB/s超大访存带宽。

作者 | ZeR0

编辑 | 漠影

芯东西6月17日报道,今日,北京AI芯片创企算苗科技宣布,其面向大模型推理的第一代3D TokenPU芯片A4E已于今年6月15日正式流片,第二代芯片A4S定义基本完成,预计2027年2月流片。

A4E是一款依托国产供应链、采用3D混合堆叠架构的大模型专用处理器,旨在提供自主可控、高性能、高性价比的算力支撑。

算苗科技成立于2022年11月,专注3D架构AI云端大算力芯片研发设计,定位为大模型时代原生的算力芯片企业,首创3D TokenPU架构,跳出通用GPU的设计思路,专攻推理场景极致性能。

其核心客户为头部大模型厂商,已联手客户开展近一年的深度研发工作;从芯片定义阶段便针对真实推理场景需求,完成架构与底层算法深度调优。

“我们不是在别人的赛道上追赶,而是在开辟新的方向。”算苗科技创始人兼CEO汪福全博士说,“3D TokenPU专为大模型Token处理而生,不必单纯依赖制程缩小,就能实现算力密度、能效比的跨越式提升。”

3D混合键合技术通过缩短信号传输距离,能极致提升“性能功耗比”,是解决大模型计算饥渴与降低推理成本的有效路径。

算苗科技第一代产品A4E将8层存储晶圆垂直堆叠在计算逻辑晶圆上,通过硅通孔(TSV)与凸点(bump)技术实现微米级互联,将传统芯片间的“毫米级”传输距离压缩两个数量级,带来16TB/s的超大访存带宽,有效缓解数据饥饿问题。

在架构设计方面,算苗科技引入Tile-Native软硬件协同理念,将Tile作为数据搬运、存储和计算的基本单元,实现“一次搬运、多次复用”的高效模式。

其硬件原生支持Tile级数据调度与多精度动态切换,软件端则构建适配LLVM、Triton等开源生态的编译工具栈,兼顾开发者友好性与算子优化效率。

这种“硬件架构-软件工具-算法特性”的闭环优化,为大模型推理提供了更高性能和更低TCO(总拥有成本)。

算苗科技已构建起覆盖芯片设计、核心IP、制造、封装的国产化供应链体系。

A4E芯片基于自研RISC-V架构与自研IP自研软件体系打造,与国内头部供应链伙伴深度合作,采用成熟国产工艺也可实现卓越推理性能。

在工程化量产层面,算苗科技核心成员已在高通量存算一体芯片项目中,完成万片级3D混合堆叠晶圆的量产,是全球少数掌握该技术的团队之一。

算苗科技高管团队中,汪福全曾带领团队成功研发全球首款存算一体高通量算力芯片。

他在中科院声学所国家重点实验室攻读博士、做研究员期间师从水声物理学界泰斗张仁和院士,从事高通量阵列信号处理技术研究,毕业后在中科院计算所开展计算机体系结构专业博士后研究,合作导师为龙芯首席科学家胡伟武。

楼建光于2025年9月加入算苗科技,现任首席人工智能科学家。他博士毕业于中国科学院自动化所,师从谭铁牛院士,拥有20年机器学习、自然语言处理、人工智能和软件系统AI的研究和应用经验,是汪福全在浙大的师弟,加入算苗前曾担任微软研究院首席研究员。

其他高管中,联合创始人兼CTO刘明是中国科学院计算所博士,师从胡伟武研究员,在龙芯从事半导体研发15年,拥有两次3D堆叠芯片研发成功的经验,在算苗科技负责芯片定义;首席算法科学家闫超是中国科学院声学所博士,是汪福全的学生,拥有12年龙芯处理器研发经验、15年算法与系统研究开发经历;首席软件架构师魏永明本硕毕业于清华大学,是开源项目MiniGUI/HVML的创始人,拥有数十项软件发明专利及出版物。

算苗科技研发人员约190人,占比超过80%,来自中科院、清华、北大等院校的研发人员占比达20%,预计今年年底研发团队可扩张至300人。

该公司已完成多轮融资,投资方包括国开金融、北京顺禧等国资基金,石溪资本、联想创投等产业资本,以及源码资本、襄禾资本等投资机构。

标签: 芯片 架构 模型 首席 科技 算力 算法 博士 带宽 软件

免责声明:本网信息来自于互联网,目的在于传递更多信息,并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益,请及时联系我们,本站将会在24小时内处理完毕。