您的当前位置:首页>科技咨询>资讯详情

Meta 开源小语言模型 MobileLLM 家族:适用智能

发表于:2024-11-08 19:00:04 浏览:42次 发布者: 网易科技

IT之家 11 月 8 日消息,Meta 于上周发布新闻稿,宣布正式开源可在智能手机上运行的小语言模型 MobileLLM 家族,并同时为系列模型新增600M、1B 和 1.5B 三种不同参数版本,IT之家附项目GitHub项目页如下(点此访问)。

Meta 研究人员表示,MobileLLM 模型家族专为智能手机打造,该模型号称采用了精简架构,并引入了“SwiGLU 激活函数”、“分组查询注意力(grouped-query attention)”机制,能够在兼顾效率与表现成果。


此外,MobileLLM 模型据称训练速度较快,Meta研究人员声称他们在 32 颗 Nvidia A100 80G GPU 的服务器环境下,以 1 万亿词(tokens)训练不同参数量的 MobileLLM 模型时,1.5B 版本只需 18 天,而 125M 版本仅需 3 天

而从结果来看,MobileLLM 125M 和 350M 两款模型在零样本常识理解任务中的准确率比 Cerebras、OPT、BLOOM 等 State of the Art(SOTA)模型分别高出 2.7% 和 4.3%。



Meta研究人员同时将 MobileLLM-1.5B 与业界其他参数量更大的模型进行比较,在结果测试方面据称领先 GPT-neo-2.7B、OPT-2.7B、BLOOM-3B、Qwen 1.5-1.8B 等模型。

猜你喜欢

蜜雪冰城上线“支付宝碰一下”支付,覆盖全国超
蜜雪冰城上线“支付宝碰一下”支付,覆盖全国超
发表于:2025-05-22 浏览:15 发布者: 网易互联网
在这个日本爆火的App里,日本人不许说日语。
在这个日本爆火的App里,日本人不许说日语。
发表于:2024-12-22 浏览:37 发布者: 网易互联网
雷鸟Air 3定价1699元!年底将上线首款AI拍照眼
雷鸟Air 3定价1699元!年底将上线首款AI拍照眼
发表于:2024-10-29 浏览:36 发布者: 网易科技
谷歌(GOOGL.US)推出Gemini 2.5 Pro升级预览版
谷歌(GOOGL.US)推出Gemini 2.5 Pro升级预览版
发表于:2025-06-06 浏览:11 发布者: 网易互联网
宝马将基于通义大模型和斑马元神AI推出两款AI智
宝马将基于通义大模型和斑马元神AI推出两款AI智
发表于:2025-03-26 浏览:18 发布者: 网易互联网
全网轰动!DeepSeek超越ChatGPT,登顶美区
全网轰动!DeepSeek超越ChatGPT,登顶美区
发表于:2025-01-27 浏览:27 发布者: 网易科技
赶在加税前最后一刻!美国消费者挤爆苹果门店疯
赶在加税前最后一刻!美国消费者挤爆苹果门店疯
发表于:2025-04-08 浏览:18 发布者: 网易IT
美团回应“男子恶意退款诈骗小哥”:已限制下单
美团回应“男子恶意退款诈骗小哥”:已限制下单
发表于:2025-07-07 浏览:9 发布者: 网易互联网
科大讯飞发布本地大模型智能办公本X5售价4999元
科大讯飞发布本地大模型智能办公本X5售价4999元
发表于:2025-07-22 浏览:5 发布者: 网易IT
B站盈利,全靠游戏?
B站盈利,全靠游戏?
发表于:2024-11-19 浏览:38 发布者: TechWeb