据报道,苹果提出“多token预测”(MTP)技术,在不牺牲输出质量的情况下,可将大语言模型响应速度提升2至3倍,特定场景下最高可达5倍。传统大语言模型逐个输出token,速度受限。苹果研究发现模型内部蕴含对后续多个词的潜在判断能力,据此提出MTP框架,支持模型一次生成多个词。该技术通过“掩码”token作为占位符,并行推测后续多个词,并在推测结果与标准自回归解码结果不符时自动回退,确保输出质量。实验基于开源模型Tulu3 - 8B进行,训练其最多推测8个后续token,在问答和对话等通用任务中,响应速度平均提升2至3倍;在代码生成、数学推理等结构化场景中,提速可达5倍。
苹果MTP技术:大语言模型响应速度最高提升5倍
IP属地 中国·北京 编辑:钟景轩 三言科技 时间:2025-08-09 12:19:13
免责声明:本网信息来自于互联网,目的在于传递更多信息,并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益,请及时联系我们,本站将会在24小时内处理完毕。
全站最新
热门推荐
- 机器人租赁火出圈,有企业机器人租赁订单排到3月底
- Netflix放弃收购华纳兄弟
- 特斯拉无人驾驶技术在阿布扎比完成道路实测
- 我国电动汽车充电基础设施总数达2069.8万个
- 打了个漂亮翻身仗!Kimi靠「养龙虾」暴富,出海真香?
- 领克就语音助手误关大灯致车祸道歉 智能汽车安全底线讨论再起
- 下一个万亿赛道“人形机器人”谁主沉浮?现代汽车携“阿特拉斯”叫板特斯拉“擎天柱”
- 淘宝闪购:响应网络餐饮新规织密食安防线,持续夯实“3+1+AI”数字化共治体系
- 索尼WH-1000XM6头戴式耳机新增“暮砂粉”配色,国行售2499元
- 推特创始人杰克多西的金融科技公司宣布裁员40%,用AI替代员工
- 刚刚 | 豆包严正声明!
- 美国发动网攻侵占全球虚拟资产
- 领克Z20语音指令误关大灯致高速撞车,官方紧急OTA补漏
- 擎天租全国城市合伙人迎来“饱和式报名”,原计划600人来了16000人
- 在巴展发布AI眼镜,千问将面向全球推出多款AI硬件产品





京公网安备 11011402013531号