您的当前位置:首页>科技咨询>资讯详情

Meta发布开源大模型Llama 4,混合专家架构引领A

发表于:2025-04-06 20:00:02 浏览:19次 发布者: 网易科技

2025年4月5日,美国科技巨头Meta正式发布了其最新一代开源人工智能模型Llama 4。作为Meta在AI领域的重要突破,Llama 4不仅首次采用了混合专家(MoE)架构,还以其多模态处理能力和高效的计算效率,成为人工智能技术发展的重要里程碑。

Llama 4系列目前包含两个版本:Scout和Maverick。Scout拥有170亿个活跃参数、16个“专家”模型和1090亿个总参数,而Maverick则具备170亿个活跃参数、128个“专家”模型和高达4000亿的总参数量。这种混合专家架构通过将复杂任务分解为子任务,并由专门的“专家”模型处理,显著提升了模型的训练和推理效率。Meta表示,这种设计使得Llama 4在处理多模态数据(如文本、图像、视频和音频)时表现出色,能够在不同格式之间灵活转换内容。

此外,Meta还在训练一款更为强大的模型Behemoth,称其为“新模型中的教师”。所有Llama 4系列模型均经过大量未标注的文本、图像和视频数据的训练,具备广泛的视觉理解能力。目前,Scout和Maverick已在Llama.com网站及Meta的合作伙伴平台公开获取,并集成到WhatsApp、Messenger和Instagram Direct等应用中。Meta AI助手已在40个国家更新为使用Llama 4模型,尽管多模态功能目前仅在美国以英语提供。

Meta首席执行官马克·扎克伯格在发布会上表示,Meta的目标是建立世界领先的人工智能,并将其开源,以造福全球用户。他提到,开源人工智能将成为未来的主导模型,而Llama 4的推出标志着这一趋势的开始。Meta首席产品官Chris Cox此前也曾表示,Llama 4将显著提升AI智能体的推理和行动能力。

然而,Llama 4的开发并非一帆风顺。据知情人士透露,该模型在技术基准测试中未能完全达到Meta的预期,尤其是在推理和数学任务方面。此外,Meta也对其在模拟人类语音对话方面的表现感到担忧。尽管如此,Meta计划今年投入高达650亿美元扩展其AI基础设施,以应对日益激烈的市场竞争。

Llama 4的发布不仅是Meta在AI领域的一次重要尝试,也为开源人工智能的发展提供了新的方向。混合专家架构的应用,标志着AI模型设计从单一任务向多任务协同的转变,为未来更高效、更智能的AI系统奠定了基础。随着技术的不断演进,Llama 4有望在更多领域展现其潜力,推动人工智能技术的普及与应用。

本文源自:金融界

作者:观察君

猜你喜欢

豪掷50亿“备战”618!天猫增速放缓下的背水一
豪掷50亿“备战”618!天猫增速放缓下的背水一
发表于:2025-05-08 浏览:13 发布者: 网易互联网
2024 Web3.0创新大赛暨颁奖典礼在沪圆满落幕
2024 Web3.0创新大赛暨颁奖典礼在沪圆满落幕
发表于:2025-02-27 浏览:25 发布者: 网易互联网
手机1%的电量能用多久?你以为要关机 结果能挺半小时
手机1%的电量能用多久?你以为要关机 结果能挺半小时
发表于:2024-10-31 浏览:58 发布者: 央视
五月天联名杯二手炒到1000元,星巴克否认在搞饥
五月天联名杯二手炒到1000元,星巴克否认在搞饥
发表于:2025-04-29 浏览:14 发布者: 网易互联网
淘宝闪购全面助燃各地夜经济活力:多地夜间订单
淘宝闪购全面助燃各地夜经济活力:多地夜间订单
发表于:2025-07-15 浏览:6 发布者: 网易互联网
马云再次现身引热议!DeepSeek爆火,阿里巴巴能
马云再次现身引热议!DeepSeek爆火,阿里巴巴能
发表于:2025-02-12 浏览:30 发布者: 网易互联网
美团创始人清空微博?知情人士回应
美团创始人清空微博?知情人士回应
发表于:2025-04-24 浏览:19 发布者: 网易互联网
京东外卖:系统故障已全面恢复
京东外卖:系统故障已全面恢复
发表于:2025-05-14 浏览:15 发布者: 网易互联网
Meta据悉正在开发人工智能搜索引擎
Meta据悉正在开发人工智能搜索引擎
发表于:2024-10-29 浏览:40 发布者: 网易科技
谁在直播间“割韭菜”?|直播带货消费维权舆情
谁在直播间“割韭菜”?|直播带货消费维权舆情
发表于:2025-03-14 浏览:19 发布者: 网易互联网