某高校HPC选型立项会现场
几位大甲方正在激烈讨论…
这位副院长所说的分享,其实是
上周某「科研算力基础设施」闭门会
会上,一位大型科研机构的研究员
讲出了自己单位的HPC选型心得
他的开场白,有这么一段
「我不是反对GPU,但我们所里大部分HPC集群,还都是用CPU来搭建的」
为啥选CPU呢?这位专家继续解释
↓
在我们科研单位,一个HPC集群
通常要承载不同科研任务
这些任务,来自不同科研团队
对算力的需求,也是千差万别
有的吃缓存、有的吃IO、有的吃主频
CPU可以更灵活应对这些负载,效率奇高
还有,我们跑的软件
都是科研软件,一般人都没听过
大量科研软件,都优先支持CPU
这些软件的厂家,更愿意在CPU上做优化
总之,科研任务「杂而重」
CPU是全能型选手(性能、灵活性、兼容性)
扛活儿能力更强
基本逻辑搞明白,接下来问题是
市面上CPU,选哪款比较好?
当然是
↓
第五代AMD EPYC 处理器
Turin系列中的
这也是AMD最新一代CPU
话说,这款“9755”一问世
就被很多科研大佬疯狂点赞
他们也有过买不到合适算力卡的苦恼
结果“9755”把这些高端大活儿都包办了
这颗“懂科研的CPU”
一口气解决困扰科研人员的六大难题
↓
HPC机房是科研院所的香饽饽
每个课题组都在抢资源
之前大家都是轮流排队共用
动不动就是几十个仿真任务同时跑
而且个个大活儿,负载重、周期长
采用AMD EPYC 9755
可以有效缓解HPC机房的排队状况
↓
因为这家伙的性能确实强悍
采用先进的4nm制程
单颗CPU,高达128核,256 个线程
更有同门师兄“9965”甚至能提供192核
以一台双路HPC节点为例
搭载2颗 AMD EPYC 9755
单节点算力,就能飙到22.12TFlops
干起活来嗖嗖快
↓
而且,“9755”采用了全新Zen 5架构
具备了更高IPC(每时钟指令数)
IPC越高,CPU单位时间内处理任务越多
相比上一代Zen 4架构
通用任务快17%,AI和科研任务快37%
一个典型科研计算任务
比如迭代计算、量子化学模拟
需要稳定计算
极大挑战CPU的“抗压能力”
这期间要:不降频,不掉速,全程拉满
而“9755”专干这种大场面
高频稳定输出,一口气干到底
它基础频率 2.7GHz,最高可达4.1GHz
还有能飙到5GHz的同门兄弟
好比一场科研马拉松长跑
起跑快、途中快、冲刺快,全程不降速
有些科研任务
可能包含大规模矩阵乘、浮点运算等
比如结构力学、流体力学、电磁场仿真等
要是CPU不给力,漫长等待如炼狱
莫慌,“9755”支持AVX-512指令集
具有完整的512b数据路径
这可是应对矩阵计算的秘笈
让它可以全程保持较高的全核频率
算得又快又稳,告别漫长等待
大型计算任务,往往伴随海量数据
不是算不动,而是数据“堵在半路了”
内存带宽跟不上,IO通道也拥堵
数据加载慢一步,CPU就只能躺平
AMD EPYC 9755早就修好数据高速路
首先,大缓存拉满
配备高达512MB的L3缓存
热数据直接放在自己“被窝”里
先来一波“近场访问”,绝对不卡壳
第二,内存通道拉满
每颗CPU支持12通道DDR5内存
内存容量最高可扩展到 6TB
第三,内存速率拉满
最高支持6400MT/s
数据加载又快又稳
最后,高速IO拉满
支持PCIe 5.0 + CXL 2.0
高速设备随心扩展,数据流转畅通无阻
科研软件是“有脾气”的
有的对缓存特别敏感
就要大缓存、高内存带宽
有的盯着频率,主频越高越欢
有的看核数,偏爱高核心数
AMD EPYC 9755好比超级大厨
能够满足各种软件的不同胃口
高核心数、高频率、大L3缓存、高IPC、
12通道 DDR5 6400、AVX-512...
还有一点,它是X86架构
生态兼容性好,适配度和优化完善
HPC集群一上量
采购成本、运营成本,都是大开支
电老虎一发威,每年动辄百万级电费
AMD EPYC 9755堪称性价比王者
前期采购看→相同预算,算力更高
同样规模下,搭载“9755”的集群
拥有更多核数、更高主频、更强算力
算效比更高
后期上线看→相同电费,效率更高
“9755”能效比高,功耗更低
跑同样多任务,电费省下一大笔
长远运营看→便于内部统一统筹
搭载“9755”的集群支持高效虚拟化调度
单位可以将HPC集群统一建设和管理
避免院系、科室自建,造成浪费
既能提供超大规模算力
又能按需灵活分配资源
怎么样,科研场景六大难点
AMD EPYC 9755全部攻克
让每个科学计算项目,都丝滑无比
让科研经费的每分钱,都花在刀刃上