当前位置: 首页 » 资讯 » 新科技 » 正文

谷歌推出压缩算法TurboQuant,宣称实现约6倍内存节省

IP属地 中国·北京 编辑:朱天宇 鞭牛市 时间:2026-03-26 12:28:59

3月26日,谷歌推出一种可能降低人工智能系统内存需求的压缩算法TurboQuant。TurboQuant压缩技术旨在降低大语言模型和向量搜索引擎的内存占用。

该算法主要针对AI系统中用于存储高频访问信息的键值缓存(key-value cache)瓶颈问题。随着上下文窗口变大,这些缓存正成为主要的内存瓶颈。

TurboQuant可在无需重新训练或微调模型的情况下,将键值缓存压缩至3bit精度,同时基本保持模型准确率不受影响。对包括Gemma等开源模型的测试显示,该技术可实现约6倍的键值缓存内存压缩效果。(财联社)

免责声明:本网信息来自于互联网,目的在于传递更多信息,并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益,请及时联系我们,本站将会在24小时内处理完毕。