当前位置：首页 » 资讯 » 新科技 » 正文

性能真的不重要了吗？Jeff Dean给出反常答案

IP属地中国·北京 新智元 时间：2025-12-28 18:13:49

新智元报道
编辑：倾倾
很多人背着「过早优化是万恶之源」的名言，写出的却是处处漏风的代码。Google传奇Jeff Dean的这份笔记破了真相：性能不是最后调出来的，而是你在选第一个容器、敲第一行代码时，就已经注定的物理结局。
2025年，是个很容易让人产生错觉的时间点。
这时算力不再稀缺，云资源随叫随到，AI已经能写出准确无误的代码。
在这样的环境里，「性能」似乎正在悄悄贬值。因为代码写得慢一些，好像也没什么大不了。
就在这种氛围下，Google的传奇工程师Jeff Dean更新了一份老文档：Performance Hints。

比起一篇炫技的论文，它更像是一份老派工程师的随笔，里面重新整理了基础法则。
它反复重申一个事实：计算机底层的物理规则，从未因为云原生、AI或硬件的进步而改变。
硬件的进步掩盖了代码的低效，这些问题会在系统中不断堆积，直到成为无法绕开的成本。
「过早优化」，成了平庸代码的豁免权
所有工程师都听过一句老话：
Premature optimization is the root of all evil.（过早优化是万恶之源）。
它原本是提醒我们，别为了抠几行代码，把系统搞成一团乱麻。
但在实践中，这句话慢慢变了味，成了一个免责口令——只要遇到性能质疑，一句「别过早优化」就能把所有问题挡回去。
结果走向了另一个极端：写代码时，性能被整体忽略。抽象可以多一层，数据可以多拷贝一次，API可以写得更「通用」。

瑞士奶酪模型：单个小漏洞没事，但是一层层叠加，对齐了会出大事
大家总觉得将来有profiler，等真慢下来再说。
可等系统上线，流量涌入，响应开始变拖沓，大家终于打开性能分析图，却发现屏幕上什么都没有。
没有一个函数占掉40%的时间，没有明显的性能热点。你看到的只有一张异常平坦的火焰图——每一层都慢一点，每一个看似无关紧要的选择，都给未来埋下隐患。
你很难指出哪里出了错，因为问题从一开始就没有集中出现——这正是Jeff Dean反复强调的一种模式。
性能不是被某个错误决定拖垮的，而是被一连串「看起来没问题」的决策慢慢稀释掉的。

一旦走到这一步，优化会变得异常昂贵，因为你失去了明确的下手点。
所谓「关键的3%」，指的从来不是写完代码后再去抠字眼，而是在写第一行代码时，就要避开那些虽然方便、但明显低效的路径。
这不只是技巧，更像一种素养。真正拉开差距的地方，往往发生在profiler还没派上用场之前。
5ns和5ms之间，隔着整个物理世界
如果说前面的区别发生在「已经来不及了」，那么接下来要说的是：「为什么我们会在一开始就走错路」。
事实上，很多工程事故并不是因为「不会优化」，而是因为对「慢」没有感觉。
在编辑器里，5ns和5ms看起来只是多了几个0。缩进一样，语法一样，在Code Review时看起来合理合规。
但在物理世界，这些数字根本不属于同一个尺度。
Jeff Dean在清单里列出了一张延迟对照表。一旦把这些数字还原成现实中的时间，很多所谓的设计直觉会当场崩塌。
L1缓存命中：约0.5ns，等于微观世界里的一次脉搏。
分支预测失败：5ns，是连续十次脉搏。
主存访问：50ns，相当于起个身，走下楼，取了个外卖。
随机磁盘寻址：10000000ns，相当于从北京一路走到了上海。

最早由Google工程师整理，Jeff Dean在多次演讲中用过这个思路
如果你的方案里出现了一次磁盘寻址，后面无论代码写得多优雅、逻辑多漂亮，在物理尺度上都已经输透了。
这就是顶级工程师脑子里的「物理地图」。他们本能地知道：哪些操作属于同一量级，而哪些操作一旦混进来，系统的节奏就彻底乱了。
这也是「信封背面估算」（Back-of-the-envelope calculation）的价值所在。
它是一次动手之前的排查：这个方案会触发多少次内存访问？有没有隐藏的分配？循环里会不会撞上网络IO？
如果答案里出现了一个不合时宜的量级，这个方案就应该被扔进垃圾桶。
很多性能问题并非「实现得不够好」，而是选错了路径。
一旦建立起这种尺度感，很多无意义的争论就能一眼看穿。
反直觉的真相：Google大佬的代码为什么看起来很「土」？
真正拉开差距的地方，不在于「写得多聪明」，而在于知道哪些地方「不值得聪明」。
翻开这份Performance Hints，我们能发现一个反直觉的事实：没有复杂的算法，很多改动看起来都有点「土」。
但这些细碎的选择，却被Jeff Dean反复拿出来强调。
对内存的节制
「尺度感」让我们意识到分配内存的珍贵，在实战中，这种意识会转化成对容器的极致考究。
为什么他们偏爱InlinedVector？因为在绝大多数场景下，它根本不碰堆内存，数据直接躺在栈上。
这带来的是实实在在的物理收益：少一次分配，多一次缓存命中。
同样的，使用Arena（内存池）也不只是为了管理方便，而是为了让数据在物理内存上变得连续，顺应CPU缓存的节奏。
对数据分布的尊重
所谓的Fast Path（快路径），本质上是承认世界是不均匀的。99%的请求和输入都比想象中普通。
如果坚持让每一次调用都走那条「最通用、最保险」的路，实际上是在用极少数的边缘情况，绑架绝大多数的正常流量。

清单里提到的UTF-8处理就是一个典型：现实中大量字符串其实只有纯ASCII字符。
如果一上来就按完整的解析逻辑走，那每一个字节都在为万分之一的极端情况买单。
看一眼，是ASCII就直接放行——这种行为，建立在对数据规律的尊重之上。
对抽象成本的自觉
清单里举了个例子：把Protobuf逻辑改成原生结构体，性能提升20倍，让很多人不安。
Protobuf确实解决了跨语言和版本演进的难题，但便利从不是免费的，每一层封装、每一次解析，都是一笔隐蔽的「抽象税」。
就像在透支信用卡，你可以尽情购物，可一旦账单寄来，就要付出相应代价。

抽象并不会消失，只是被编译器展开，最终落实到一行行具体的实现上。
当抽象层数不断叠加，成本也会在底层被一并兑现。
这就是为什么他们建议在热路径里避开不必要的层级、避开那些「为了完整而完整」的设计。
目的是让你清楚地意识到，你到底在为什么付费。
顶级工程师关心的，从来不是如何写出最聪明的代码，而是如何避免那些本不该出现的开销。
当你在敲键盘时，能对分配、分布、抽象成本保持警惕，很多性能瓶颈在发生之前，就已经被挡在了门外。
想提高性能，就不能对代价视而不见
很多人把性能理解成一种阶段性的工作：系统慢了，就开始优化；不慢，就先放一边。
但读完这份清单，你很难再这样看待它。
Jeff Dean们反复强调的，其实不是「如何省下几纳秒」，而是「你是否真正理解自己正在使用的计算资源」。
CPU、内存、缓存、磁盘......这些底层的物理规律并没有因为云原生或AI的流行而消失，它们只是被包装得更抽象了。
顶级工程师之所以显得从容，是因为他们很少走到「火场」里：在写第一行代码时，他们就已经避开了那些注定昂贵的路径。
这份Performance Hints读起来不像教程，更像是一份肌肉记忆。它不要求你处处极限优化，而是要求你在做决策时，不要假装不知道代价。
也许真正的分界线一直是——当你写下一个循环、设计一个数据结构、决定要不要多加一层时，脑海中是否浮现出那张时间和尺度的地图。
一旦有了它，很多平庸的代码，你就再也写不下去了。
参考资料：
https://x.com/JeffDean/status/2002089534188892256?s=20
秒追ASI
⭐点赞、转发、在看一键三连⭐
点亮星标，锁定新智元极速推送！

免责声明：本网信息来自于互联网，目的在于传递更多信息，并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益，请及时联系我们，本站将会在24小时内处理完毕。

同类资讯

我国最大舱容耙吸挖泥船“双子星”完成海试，体量堪比航母

高德开放平台推出业内首个全栈自研「鸿蒙司机端SDK」

我国6吨级倾转旋翼无人飞行器在四川首飞

老黄200亿“钞能力”回应谷歌：联手Groq，补上推理短板

“成都都市圈”出手：全球首款6吨级倾转旋翼无人飞行器首飞

AI正在闯入你的深夜

全站最新

我国最大舱容耙吸挖泥船“双子星”完成海试，体量堪比航母

高德开放平台推出业内首个全栈自研「鸿蒙司机端SDK」

我国6吨级倾转旋翼无人飞行器在四川首飞

老黄200亿“钞能力”回应谷歌：联手Groq，补上推理短板

热门推荐

重庆宣布追加1.6亿元汽车置换更新补贴

【观天下】俄年度热词聚焦“胜利”“人工智能”　“拉布布”也上榜

我国最大舱容耙吸挖泥船“双子星”完成海试，体量堪比航母

高德开放平台推出业内首个全栈自研「鸿蒙司机端SDK」

我国6吨级倾转旋翼无人飞行器在四川首飞

老黄200亿“钞能力”回应谷歌：联手Groq，补上推理短板

“成都都市圈”出手：全球首款6吨级倾转旋翼无人飞行器首飞

全球首款6吨级倾转旋翼飞行器成功首飞

AI正在闯入你的深夜

小鹏汽车联合北大提出全新视觉Token剪枝框架

评论丨充25年爱奇艺会员退费难，原路退回是不是霸王条款？

科学圆桌会·趣谈2025|天文科普专家：重温春夏秋冬那些仰望星空的美妙瞬间

『重塑2025』年终策划③丨未来已来，人类何往？

性能真的不重要了吗？Jeff Dean给出反常答案

2025金融大模型评测体系在沪发布