您的当前位置:首页>科技咨询>资讯详情

苹果MTP技术:大语言模型响应速度最高提升5倍

发表于:2025-08-09 14:00:06 浏览:18次 发布者: 网易互联网

据报道,苹果提出“多token预测”(MTP)技术,在不牺牲输出质量的情况下,可将大语言模型响应速度提升2至3倍,特定场景下最高可达5倍。传统大语言模型逐个输出token,速度受限。苹果研究发现模型内部蕴含对后续多个词的潜在判断能力,据此提出MTP框架,支持模型一次生成多个词。该技术通过“掩码”token作为占位符,并行推测后续多个词,并在推测结果与标准自回归解码结果不符时自动回退,确保输出质量。实验基于开源模型Tulu3 - 8B进行,训练其最多推测8个后续token,在问答和对话等通用任务中,响应速度平均提升2至3倍;在代码生成、数学推理等结构化场景中,提速可达5倍。

猜你喜欢

三星二代3nm良品率只有可怜的20%!一代也还不合格
三星二代3nm良品率只有可怜的20%!一代也还不合格
发表于:2024-11-13 浏览:84 发布者: 网易新闻
中国电信申请VR教学方法、装置和VR教学系统专利
中国电信申请VR教学方法、装置和VR教学系统专利
发表于:2025-06-29 浏览:24 发布者: 网易科技
饿了么、飞猪加入阿里中国电商事业群
饿了么、飞猪加入阿里中国电商事业群
发表于:2025-06-23 浏览:50 发布者: 网易互联网
华为乾崑智驾加持 方程豹豹8正式上市,开启智能越野新时代
华为乾崑智驾加持 方程豹豹8正式上市,开启智能越野新时代
发表于:2024-11-15 浏览:68 发布者: iMobile手机之家
京东重剑 美团轻舟
京东重剑 美团轻舟
发表于:2025-08-04 浏览:21 发布者: 网易互联网
对话国台李长文:国台已基本实现生产自动化、智能化
对话国台李长文:国台已基本实现生产自动化、智能化
发表于:2024-11-26 浏览:60 发布者: 酒业内参
京东外卖亮相2025中国连锁餐饮峰会 品质外卖构
京东外卖亮相2025中国连锁餐饮峰会 品质外卖构
发表于:2025-04-15 浏览:36 发布者: 网易互联网
OceanBase的生态生意经
OceanBase的生态生意经
发表于:2025-04-03 浏览:41 发布者: 网易互联网
马斯克:中国用户对FSD最为苛刻 特斯拉机器人
马斯克:中国用户对FSD最为苛刻 特斯拉机器人
发表于:2025-04-23 浏览:29 发布者: 网易IT
“字节跳动随意取消离职员工期权”?抖音回应;
“字节跳动随意取消离职员工期权”?抖音回应;
发表于:2025-07-29 浏览:18 发布者: 网易互联网