您的当前位置:首页>科技咨询>资讯详情

Meta 开源小语言模型 MobileLLM 家族:适用智能

发表于:2024-11-08 19:00:04 浏览:38次 发布者: 网易科技

IT之家 11 月 8 日消息,Meta 于上周发布新闻稿,宣布正式开源可在智能手机上运行的小语言模型 MobileLLM 家族,并同时为系列模型新增600M、1B 和 1.5B 三种不同参数版本,IT之家附项目GitHub项目页如下(点此访问)。

Meta 研究人员表示,MobileLLM 模型家族专为智能手机打造,该模型号称采用了精简架构,并引入了“SwiGLU 激活函数”、“分组查询注意力(grouped-query attention)”机制,能够在兼顾效率与表现成果。


此外,MobileLLM 模型据称训练速度较快,Meta研究人员声称他们在 32 颗 Nvidia A100 80G GPU 的服务器环境下,以 1 万亿词(tokens)训练不同参数量的 MobileLLM 模型时,1.5B 版本只需 18 天,而 125M 版本仅需 3 天

而从结果来看,MobileLLM 125M 和 350M 两款模型在零样本常识理解任务中的准确率比 Cerebras、OPT、BLOOM 等 State of the Art(SOTA)模型分别高出 2.7% 和 4.3%。



Meta研究人员同时将 MobileLLM-1.5B 与业界其他参数量更大的模型进行比较,在结果测试方面据称领先 GPT-neo-2.7B、OPT-2.7B、BLOOM-3B、Qwen 1.5-1.8B 等模型。

猜你喜欢

免费!OpenAI推出ChatGPT搜索功能
免费!OpenAI推出ChatGPT搜索功能
发表于:2024-12-18 浏览:26 发布者: 网易互联网
阿里开源千问3向量模型
阿里开源千问3向量模型
发表于:2025-06-06 浏览:2 发布者: 网易互联网
12月31日外媒科学网站摘要:如果人类不会说话,
12月31日外媒科学网站摘要:如果人类不会说话,
发表于:2024-12-31 浏览:27 发布者: 网易科技
Waymo自动驾驶出租车周订单突破20万 大幅领先对
Waymo自动驾驶出租车周订单突破20万 大幅领先对
发表于:2025-02-28 浏览:19 发布者: 网易IT
小红书被指频繁获取用户信息,有用户3天内被访
小红书被指频繁获取用户信息,有用户3天内被访
发表于:2025-03-27 浏览:14 发布者: 网易互联网
CES观察|AI眼镜出圈、清洁电器争锋、显示技术
CES观察|AI眼镜出圈、清洁电器争锋、显示技术
发表于:2025-01-10 浏览:62 发布者: 网易科技
李彦宏和马化腾,都想通了
李彦宏和马化腾,都想通了
发表于:2025-02-18 浏览:16 发布者: 网易互联网
华为Mate品牌盛典举行   万兴科技旗下亿图脑图MindMaster鸿蒙版亮相
华为Mate品牌盛典举行 万兴科技旗下亿图脑图MindMaster鸿蒙版亮相
发表于:2024-11-28 浏览:31 发布者: ZOL中关村在线
拼多多(PDD.US)“钉钉子”背后:“千亿扶持”
拼多多(PDD.US)“钉钉子”背后:“千亿扶持”
发表于:2025-05-28 浏览:7 发布者: 网易互联网
OpenAI:大多数用户GPT-4o API问题已解决
OpenAI:大多数用户GPT-4o API问题已解决
发表于:2025-03-18 浏览:15 发布者: 网易互联网