您的当前位置:首页>科技咨询>资讯详情

DeepSeek震撼硅谷,从数据到技术,Meta紧急组建

发表于:2025-01-27 12:00:03 浏览:24次 发布者: 网易科技

DeepSeek引硅谷巨震,Meta陷入恐慌,紧急组建研究小组。

近日,中国AI公司DeepSeek发布的R1模型(DeepSeek R1)热度飙升。1月24日,在专业大模型排名Arena上,DeepSeek-R1基准测试已经升至全类别大模型第三,其中在风格控制类模型(StyleCtrl)分类中与OpenAI o1并列第一;而其竞技场得分达到1357分,略超OpenAI o1的1352分。

据报道,面对DeepSeek的挑战,Meta迅速采取行动,已组建了多个“小组”来研究DeepSeek的技术细节。

其中两个小组正在试图了解DeepSeek如何降低训练和运行大模型的成本,第三小组正在试图弄清楚DeepSeek使用的数据集,第四小组则正在考虑基于DeepSeek模型属性重构Meta的Llama模型。

此外,DeepSeek此前在技术论文中介绍的降本方法,也已被Meta的研究小组列为重点研究对象,包括模型蒸馏(distillation)等技术。Meta希望通过这些努力,能够在即将发布的Llama 4中实现技术突破。

Meta的AI基础设施总监Mathew Oldham等高层领导此前公开表示,他们对Llama的表现感到担忧,担心其无法与DeepSeek竞争。

Meta的开发者社区也反映,尽管Llama模型是免费的,但其运行成本往往高于OpenAI的模型——因为OpenAI能够通过批量处理数百万用户的查询来降低成本,而使用Llama的小型开发者则无法达到这种规模。

OpenAI高级研究员Noam Brown上周在X上表示:

“DeepSeek表明你可以用相对较少的算力获得非常强大的AI模型。”

猜你喜欢

3B挑战70B!月之暗面Kimi-VL新版开源:数学、视
3B挑战70B!月之暗面Kimi-VL新版开源:数学、视
发表于:2025-06-24 浏览:7 发布者: 网易互联网
SpaceX宣布最早将在两周内再次试飞星舰
SpaceX宣布最早将在两周内再次试飞星舰
发表于:2024-11-07 浏览:43 发布者: 网易科技
爱奇艺收入、利润双双大幅下滑!
爱奇艺收入、利润双双大幅下滑!
发表于:2025-05-22 浏览:17 发布者: 网易互联网
广告打到田间地头,年入6600亿的腾讯猛砸AI,元
广告打到田间地头,年入6600亿的腾讯猛砸AI,元
发表于:2025-03-20 浏览:26 发布者: 网易互联网
用数字技术赋能线下经济千行百业
用数字技术赋能线下经济千行百业
发表于:2024-12-30 浏览:33 发布者: 网易互联网
早资道丨京东外卖上线自营外卖门店;去年网络文
早资道丨京东外卖上线自营外卖门店;去年网络文
发表于:2025-07-22 浏览:4 发布者: 网易互联网
花旗:上调Meta目标价至690美元 核心AI焦点领域
花旗:上调Meta目标价至690美元 核心AI焦点领域
发表于:2025-05-04 浏览:19 发布者: 网易科技
平台表态卷没意义,高温下的外卖价格战应回归
平台表态卷没意义,高温下的外卖价格战应回归
发表于:2025-07-18 浏览:6 发布者: 网易互联网
2025 年 CES,为什么变成了世界最大「眼镜城」
2025 年 CES,为什么变成了世界最大「眼镜城」
发表于:2025-01-10 浏览:51 发布者: 网易科技
网友直呼今年618“手推波”!今晚8点正式开启
网友直呼今年618“手推波”!今晚8点正式开启
发表于:2025-05-16 浏览:13 发布者: 网易互联网