当前位置: 首页 » 资讯 » 新科技 » 正文

用iPhone级价格造出个人超算,清华博士创业拓展个人计算能力边界

IP属地 中国·北京 DeepTech深科技 时间:2025-12-22 00:07:22

2024 年冬天,95 后博士田洋辞去高校教职创立了寅谱计算。随后,同样为 95 后博士的熊巍以 CTO 兼联合创始人的身份加入,共同搭建公司的核心团队。

“我们最初的想法很简单:能不能把我们在研究高性能计算时学到的技术,用到普通人能买得起和用得上的设备上?”熊巍告诉 DeepTech。这位年轻的 CTO 刚刚完成博士论文答辩,并在几天后的发布会上以新的身份亮相。

熊巍与 CEO 田洋的经历存在着诸多相似之处:两人都曾在华为 2012 实验室从事研究工作,均为清华大学博士,并在博士阶段提前毕业,也都放弃了原本稳定且清晰的职业发展路径。而正是这种经历上的相似,使他们对计算技术的发展趋势的判断上形成了高度一致的共识。

“AI 时代到来后,我们观察到一个明显的现象,算力在发展与竞争层面正在造成新的不平等,”熊巍表示,“在今年的求职与招聘中,是否熟练使用 AI 工具、是否具备部署文生图模型的实践经验,已成为面试中的高频问题;与此同时,AI 智能体孵化了大量一人公司和小型工作室,但由于这些基于 AI 的‘数字员工’需要处理敏感业务数据,模型与数据往往难以上云;此外,今年年初,不少中小学尝试开展 AI 教育,仅在起步阶段往往就需要投入动辄数十万元的服务器集群,甚至还要配套建设专门的机房,才能支撑这一系统的正常运行。”

他们在工程实践中逐渐意识到,当前的解决方案具有一定的局限性。2025 年初,随着 DeepSeek 等大模型在国内的爆火,市场上涌现出一批一体机产品,但这些设备大多采用传统服务器的形态,价格昂贵、运维复杂,且功能单一。

“一台这样的刀片机可能要十来万元,买来很可能只能用于干这一件事,还需要配备专业的机房环境。对于学校和小型企业来说,这其实是个艰难的抉择。”熊巍表示。

这也让他们看到了其中的机会:如果能将超级计算机的优化技术用到桌面级设备上,在有限的体积和成本约束下,实现接近服务器级别的计算能力,就能打破这种算力门槛。


(资料图)

KLEENE:做主板的大脑,让硬件智能地协作

寅谱计算的诞生并非源于宏大的改变世界叙事,而是一群极客们出于对计算本身的热爱与技术理想,自然汇聚在一起。在公司成立的一年后,他们正式向外界介绍了主板智控系统 KLEENE 与桌面高性能计算机 Infplane Personal Workstation:Hilbert。

KLEENE 的起点,来自该团队对芯片制程提高所带来系统性影响的观察。随着计算芯片制程的提高,晶体管尺寸开始接近物理极限,同一型号芯片之间,在性能和稳定性等方面的体质差异开始变得不可忽略。为了保证产品的可靠性,产业链上下游不得不采用保守的策略,从电压、频率到功耗管理,整个系统层层向下兼容到较弱体质的芯片,硬件的理论能力在真实产品中被系统性地压制。

这一变化带来的影响,并不只体现在单个芯片上,而是放大到了整个系统层面。主板的整体性能,并不等于 CPU、GPU、内存和固态硬盘纸面性能的简单相加。当芯片体质差异增大,而主板与固件仍然依赖静态和统一的控制策略时,系统内部的协同效率开始明显下降。早期在复杂系统研究中的经验让他们意识到,如果缺乏对系统内部调控机制的有效优化,即便单个子组件能力足够强,整个系统的性能表现依然可能很差。大约在 2024 年前后,这一问题开始显现,逐步转化为系统层面的真实需求,并显现出明确的商业价值。

“KLEENE 是一个计算机主板智控系统,你可以把它理解为一套让主板上的各个部件聪明协作的系统,”熊巍表示,“传统的计算机硬件的调度相对静态,CPU、GPU、内存、固态硬盘往往依赖静态策略进行协作。KLEENE 通过针对这些组件进行实时建模和协同优化,能使芯片在安全范围内实现性能与功耗的动态平衡。”

这项技术的研发,源自于他们在高性能计算领域的积累。熊巍在博士阶段的研究方向为 AI 与计算物理,曾参与过与“太湖之光”相关的软件生态开发工作。

谈及二者的差异,他表示:“超级计算机追求的是极致的计算能力,而面向桌面级超算的研发,则是在妥协中求全的艺术,需要在有限的体积与成本的约束下,尽可能释放计算芯片的最大能力。”在他们看来,正是这种系统级的调优思路,使得在成本和体积受到制约的条件下,依然有机会优化出很强的性能表现,也让桌面超算成为一种可落地的工程方向。

KLEENE 系统并非针对某个特定场景的极限调控,而是一套可复用、可迁移的方法论,能够服务于笔记本电脑、台式机、手机、车载机、机器人主控等多种终端形态。它无需改变处理器硬件设计与操作系统的软件兼容性,这意味着它可以适配到现有的计算生态中。

“我们的技术护城河不是单一算法或某个专利,而是一整套系统工程能力,”熊巍说,“这源于我们团队对计算体系结构的全栈式理解,即从底层的物理定律发展到上层的应用需求。”

Hilbert:新的桌面超算

搭载 KLEENE 系统的首款产品 Hilbert,标志着寅谱计算在桌面级超算产品线的正式起步。这台边长仅为 199 毫米的立方体主机,在紧凑体积内集成了 AMD Ryzen AI Max+ 395 处理器与核显 Radeon 8060S Graphics,最高支持 128GB 统一内存,并最大可分配96GB显存。


(资料图)

硬件配置只是基础,真正让 Hilbert 不同的是它在系统级优化下的表现,这也得益于团队研发的 KLEENE 主板智控系统。在内部测试中,这台小型主机在多项基准测试中取得了以下成绩:CineBench R23 42.8k、3DMark-CPU 14566、V-Ray GPU 2166,这些数据反映了其在基础计算和图形渲染等典型场景下的计算能力。

然而,Hilbert 的目标并不是成为一个跑分冠军。“我们追求的是其在真实工作流中的稳定性、可复现性与长期体验,”熊巍说,“这台设备需要同时满足白天的生产力需求和晚上的娱乐需求,这才是我理想中的全能。”

打破 AI 算力的奢侈印象

在熊巍看来,当前端侧 AI 部署面临的最大障碍之一是成本。“一张 24GB 显存的公版 RTX 4090 显卡已经突破两万元,但它仍然无法部署超过一定规模的大模型。对于大多数用户来说,本地搭建基于大模型的工作流其实是一种奢侈。”他表示。

而 Hilbert 采用的是 128GB 高速内存方案,最大 96GB 的显存使其能够在本地部署千亿参数级别的大模型。根据内部测试,在 GPT-OSS 120B(8bit)的模型上,配合专家混合模型优化加速,推理速度可达 42tokens/s。

“我们希望算力像 Wi-Fi 一样,”熊巍表示,“一个小盒子放在家里,整个屋子的智能设备都可以通过局域网来共享它的算力,处理各种 AI 和计算任务,同时确保数据始终留在本地,以满足用户对隐私与安全的需求。”

这种设想并非空想。随着物联网设备的普及以及 AI 应用场景的增多,家庭和小型办公室比如一人公司等场景,对于本地算力的需求正在快速增长。智能家居设备不希望数据上云,但又需要智能的能力;小型工作室有财务数据、设计稿等敏感信息,既想用 AI 提高效率,又担心数据泄露。

虽然寅谱计算是一家初创公司,但在产业链上已经建立了一定的生态位。“在这个行业,单打独斗是很难的,”熊巍坦言,“计算机和半导体行业的产业链太长了,从芯片、主板设计、生产制造到销售渠道,每个环节都需要合作伙伴。”

寅谱计算的商业模式也体现了这种细微生态。一方面,公司通过 Hilbert 等终端产品直接服务目标用户;另一方面,KLEENE 主板智控系统也可以作为技术解决方案,来为芯片厂商和计算机制造商提供优化。

继 Hilbert 之后,寅谱计算计划在 2026 年发布基于 AMD 平台的第二代产品,并将整合工作站、神经网络架构搜索、网关和 Windows 游戏主机的复合能力。

年轻团队也有务实哲学

尽管团队成员多数来自清华大学等名校,各自都有丰富的履历,但在接受采访时,熊巍强调不希望过多提到个人。熊巍说:“某种意义上,团队里每个人都是一个高性能的处理器,但能维系我们向前走的是团队体系和合作机制,可以说是一个团队意义上的‘KLEENE’系统。”

“科技公司的 CEO 必须懂技术,CTO 也必须理解商业,”这是熊巍在创业过程中总结出的体会,“单一的商业思维,容易让技术团队被推向不可行的方向;而只关注技术本身,又往往容易脱离真实的市场需求。只有两者兼备,才能做出既具创新性、又真正可落地的产品。”


图 | 从右到左:熊巍、田洋(资料图)

采访接近尾声时,熊巍谈起了他对于计算技术未来的看法:“我们正处在一个重要的转折点。过去几十年里,算力资源主要集中在大公司和算力中心;而随着 AI 能力不断向端侧迁移,算力也在某种程度上逐步走向去中心化,更多个人和小团队开始能够在本地获得足够强大的算力,去处理以往难以企及的复杂任务。”

他举了一个简单的例子:一名用户希望 AI 助手学习并模拟自己的写作风格。如果完全依赖云端大模型,这类需求往往会受到隐私、数据安全以及使用成本等因素的限制;而在本地部署的情况下,AI 可以直接学习用户电脑中长期积累的本地资料,从而生成高度贴合个人风格的内容。“这种高度个性化且隐私可控的 AI 体验,是当前云端模式下难以提供的,”他说,“而我们要做的,就是尽可能降低这种体验的使用门槛。”

免责声明:本网信息来自于互联网,目的在于传递更多信息,并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益,请及时联系我们,本站将会在24小时内处理完毕。