当前位置：首页 » 资讯 » 新科技 » 正文

4000 亿参数“生啃”成功！iPhone 17 Pro 挑战本地运行超大模型，但速度只有 0.6 token

IP属地中国·北京 编辑：任飞扬 Chinaz 时间：2026-03-24 12:35:54

智能手机的算力极限在哪里?苹果的最新旗舰iPhone17Pro刚刚给出了一个既令人震撼又略显尴尬的答案。
3月23日，拥有 4000亿参数的大语言模型在iPhone17Pro上成功跑通。要知道，即便经过量化压缩，此类模型通常也需要至少200GB 的内存才能运行，而iPhone17Pro的硬件配置仅为12GB LPDDR5X 内存。
技术“黑科技”: 闪存流转与混合专家模型
在内存容量严重不足的情况下，这次“不可能的任务”主要依靠两个技术路径实现:
SSD 强行“扩容”: 借助 Flash-MoE 开源项目，设备直接从固态硬盘（SSD）向 GPU 流式传输数据，突破了物理内存的上限。
MoE 架构优势: “MoE”代表混合专家模型（Mixture of Experts），这意味着系统在生成每个单词时，只需要调用4000亿参数中的一小部分，而非全量负载。
速度硬伤:每两秒蹦出一个词
虽然“跑通了”，但实际体验距离“可用”还有巨大的鸿沟。实测显示:
生成速度: 仅为 0.6Token/秒。换句话说，大约每1.5到2秒才能生成一个单词。
功耗压力: 这种高强度的本地运算会极速消耗手机的电池寿命，发热情况也不容小觑。
行业启示:本地大模型的“奇点”将至?
尽管目前的生成速度让人“抓狂”，但这次演示的象征意义远大于实用价值。它证明了在手机端本地运行顶级规模大模型并非死路一条。
隐私护城河: 本地运行意味着数据无需上传云端，能够提供极高的隐私保护。
离线可行性: 在无网络环境下获取顶级 AI 的回复正在成为可能。
正如业内评价，“能跑起来”和“能流畅使用”是两码事。但随着算法优化与硬件迭代，当0.6token 进化到60token 时，智能手机将真正进化为随身携带的“超级大脑”。

免责声明：本网信息来自于互联网，目的在于传递更多信息，并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益，请及时联系我们，本站将会在24小时内处理完毕。

同类资讯

8成美企都在用，“中国AI双循环，美国挡不住了…”

全网都在说苏宁落幕，但真相刚好相反

倪光南院士：RISC-V已正式占据全球处理器市场的25%份额

得瑞领新PCIe Gen5 QLC SSD D8433即将首次亮相行业峰会

全球性能最高RISC-V CPU：阿里达摩院玄铁C950处理器发布

中国AI大模型爆火+大厂密集上调算力价格，奥瑞德涨停、立昂技术涨超11%

全站最新

8成美企都在用，“中国AI双循环，美国挡不住了…”

全网都在说苏宁落幕，但真相刚好相反

倪光南院士：RISC-V已正式占据全球处理器市场的25%份额

得瑞领新PCIe Gen5 QLC SSD D8433即将首次亮相行业峰会

热门推荐

从“药王”到“红海”？司美格鲁肽“专利墙”消散，十余家企业准备“虎口夺食”

三花智控：去年净利同比增长逾三成，但新能源汽车热管理产品产销量首次下滑

宁德时代旗下公司在南宁成立科技新公司

蔚来旗下澄迈电池科技公司增资至5亿

曾被传裁员的奇瑞旗下大卓智能经营异常

字节跳动申请注册Seedance商标

阿里国际在海外落地首个企业级Agent

阿里巴巴同日成立2家新数据科技公司

三星Galaxy Z Fold8折叠手机曝光

西门子在京发布新技术并与阿里巴巴深化合作

国家数据局局长刘烈宏：日均Token调用量增加，表明我国AI发展进入快速增长阶段

罗马仕电芯供应商唯一子公司注销

Anthropic 为 Claude 推出桌面控制功能支持从手机远程派发任务

谷歌 Gemini 开启“代打”模式：手机终于能自动点外卖了

扎克伯格再出手！Meta 收编 AI 创业公司 Dreamer，前小米副总裁雨果·巴拉重磅回归