当前位置：首页 » 资讯 » 新科技 » 正文

苹果CoreAI首批基准出炉，Qwen3 0.6B大幅领先，8B几乎追平MLX

IP属地中国·北京 IT之家 时间：2026-06-11 14:45:49

IT之家 6 月 11 日消息，科技媒体 Wccftech 昨日（6 月 10 日）发布博文，报道称在 2026 年全球开发者大会（WWDC）上，苹果推出 CoreAI 引擎，接替 2017 年推出的 CoreML 框架，主打端侧大模型推理。
IT之家援引博文介绍，CoreML 框架已服役 9 年，主要面向图像分类等小型静态任务；而最新接棒的 CoreAI 主要面向端侧本地推理和边缘 AI 场景，重点优化设备端大语言模型推理，重点支持更灵活的模型格式和更大的模型内存占用。
而 MLX 是苹果生态中的一个机器学习框架，更偏向研究、训练和微调任务，常被开发者拿来测试和部署本地大模型。
从首批基准来看，苹果 CoreAI 呈现“小模型强、大模型接近持平”特征。在 M4 Mac 上运行 Qwen3 0.6B 模型后，CoreAI 解码速度约为 MLX 的 2.47 倍。在 iPhone 17 Pro 上，这一优势约为 1.6 倍。
解码速度指大语言模型生成文本时，每秒能输出多少个 token，常写作 tok／s。这个指标越高，模型回复通常越快，用户等待时间越短。

在模型规模提升至 80 亿参数（Qwen3 8B，M4 Max）后，CoreAI 比 MLX 快 5%，两者解码性能几乎持平，意味着 CoreAI 的性能优势随模型规模增大而收窄。
在持续负载方面，测试显示，iPhone 17 Pro 的 GPU 在长时间运行后会较快触发温控降频，这会削弱 GPU 路线的持续吞吐。CoreML 配合苹果神经引擎（ANE，Apple Neural Engine）的组合在性能保持率方面实现反超。

横向对比其他厂商方案，针对特定模型深度优化的引擎依然更容易胜出。比如，谷歌的 LiteRT-LM 运行 Gemma 时，在 iPhone 17 Pro 上达到每秒 55.4 tokens，并且 RAM 占用仅 641 MB；作为对照，苹果 MLX 的内存占用为 2900 MB，是前者的 4.5 倍。

免责声明：本网信息来自于互联网，目的在于传递更多信息，并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益，请及时联系我们，本站将会在24小时内处理完毕。

同类资讯

DeepSeek V4正式版来了！Agent能力大幅升级，Harness能力首次亮相

36氪独家｜曾爱玲入职B站担任AI视频生成业务负责人，向CEO陈睿汇报

第一到第六，全是中国大模型

马斯克最新定调：5年内AI超越全人类智力、美国挡不住中国成为AI领跑者

横扫五大手游电竞赛事，稳坐电竞“神U”，骁龙下一站：用AI颠覆游戏世界

暴增389%！DeepSeek卷到白菜价，这家公司却靠卖Token赚翻了

全站最新

DeepSeek V4正式版来了！Agent能力大幅升级，Harness能力首次亮相

36氪独家｜曾爱玲入职B站担任AI视频生成业务负责人，向CEO陈睿汇报

第一到第六，全是中国大模型

马斯克最新定调：5年内AI超越全人类智力、美国挡不住中国成为AI领跑者

热门推荐

中广核云南新能源公司增资至138.8亿增幅约13782%

山东省财金科创产业服务合伙企业登记成立出资额2.9 亿

生态共建范本：抖音集团20余款应用深度适配鸿蒙，给所有开发者打了样

东莞金信低空经济产业创业投资基金登记成立出资额3亿

DeepSeek V4 正式版疑定档 8 月 3 日：硅基流动涨价露马脚，API 已能答对新题

微信公众号推出 AI"一键排版"：自动分段、生成小标题、匹配配图三步到位

DeepSeek V4正式版来了！Agent能力大幅升级，Harness能力首次亮相

36氪独家｜曾爱玲入职B站担任AI视频生成业务负责人，向CEO陈睿汇报

第一到第六，全是中国大模型

马斯克最新定调：5年内AI超越全人类智力、美国挡不住中国成为AI领跑者

横扫五大手游电竞赛事，稳坐电竞“神U”，骁龙下一站：用AI颠覆游戏世界

暴增389%！DeepSeek卷到白菜价，这家公司却靠卖Token赚翻了

百度萝卜快跑法务部：部分网络账号恶意制造误导性内容，已提起诉讼

租台自动驾驶汽车旅游！订单取消了车还在跑全家被困车内下不来

508天涅槃重生，荣耀做对了什么？