据报道,苹果提出“多token预测”(MTP)技术,在不牺牲输出质量的情况下,可将大语言模型响应速度提升2至3倍,特定场景下最高可达5倍。传统大语言模型逐个输出token,速度受限。苹果研究发现模型内部蕴含对后续多个词的潜在判断能力,据此提出MTP框架,支持模型一次生成多个词。该技术通过“掩码”token作为占位符,并行推测后续多个词,并在推测结果与标准自回归解码结果不符时自动回退,确保输出质量。实验基于开源模型Tulu3 - 8B进行,训练其最多推测8个后续token,在问答和对话等通用任务中,响应速度平均提升2至3倍;在代码生成、数学推理等结构化场景中,提速可达5倍。
苹果MTP技术:大语言模型响应速度最高提升5倍
IP属地 中国·北京 编辑:钟景轩 三言科技 时间:2025-08-09 12:19:13
免责声明:本网信息来自于互联网,目的在于传递更多信息,并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益,请及时联系我们,本站将会在24小时内处理完毕。
全站最新
热门推荐
- 领克家族首款旅行车07GT将于6月29日开启预售:1.9m²四层隔热防晒天幕
- 博主称导航软件开屏“摇一摇”广告影响行车安全 客服:能关、正在改进
- 网友吐槽被WPS背刺 挤爆C盘、基础功能付费:官方回应
- Fable 5准备复活?Anthropic联创:我们彻底低估了Scaling
- 5.4万亿!英伟达成AI最大地主,大模型巨头沦为算力佃农
- 逼玩家选N卡!A卡涨价自捅一刀:这下更没人买了
- 全身仅剩眼球能动!蔡磊真人出镜发布《倒计时》演讲 用AI复原声音
- 黑鲨社区关闭访问,小米商城下架黑鲨所有产品
- 24岁“AI股神”横扫华尔街 未婚妻是Anthropic CEO幕僚长
- 消息称努比亚将全部核心资源集中投入第二代豆包AI手机,暂时收缩传统手机业务
- 央视曝光廉价充电宝安全隐患,标着CCC认证却“查无此证”
- 英伟达员工抛弃“金手铐”:为何我放弃数百万美元股票也要离职
- AI抢走内存后,你下一台手机可能贵上千元
- GRPO过时了吗?
- AI知识付费“出海”:一门生意的机会、风险与转折点





京公网安备 11011402013531号