您的当前位置:首页>科技咨询>资讯详情

消息称Meta成立4个小组研究DeepSeek,基于此来

发表于:2025-01-27 16:00:02 浏览:17次 发布者: 网易科技

IT之家 1 月 27 日消息,据 Information 网站,Facebook 母公司 Meta 成立了四个专门研究小组来研究量化巨头幻方量化旗下的国产大模型 DeepSeek 的工作原理,并基于此来改进旗下大模型 Llama。


其中两个小组正在试图了解幻方量化如何降低训练和运行 DeepSeek 的成本;第三个研究小组则正在研究幻方量化可能使用了哪些数据来训练其模型;第四个小组正在考虑基于 DeepSeek 模型属性重构 Meta 模型的新技术。

1 月 20 日,DeepSeek-R1 推理大模型正式发布。据官方介绍,DeepSeek-R1 在后训练阶段大规模使用了强化学习技术,在仅有极少标注数据的情况下,极大提升了模型推理能力。在数学、代码、自然语言推理等任务上,性能比肩 OpenAI o1 正式版。

IT之家注意到,今日 Deepseek 应用已登顶苹果中国地区和美国地区应用商店免费 App 下载排行榜,在美区下载榜上超越了 ChatGPT。

猜你喜欢

微软:将美国消费者Office涨价3美元/月
微软:将美国消费者Office涨价3美元/月
发表于:2025-01-17 浏览:21 发布者: 网易互联网
报告:今年“双11”消费者吐槽主要集中于直播带
报告:今年“双11”消费者吐槽主要集中于直播带
发表于:2024-11-28 浏览:35 发布者: 网易互联网
“职业打手”下场!DeepSeek遭攻击烈度暴增百倍
“职业打手”下场!DeepSeek遭攻击烈度暴增百倍
发表于:2025-01-30 浏览:23 发布者: 网易互联网
京东物流辟谣!
京东物流辟谣!
发表于:2024-11-16 浏览:45 发布者: 网易互联网
从「黑科技」到「量产」,爱奇艺的虚拟制作进化
从「黑科技」到「量产」,爱奇艺的虚拟制作进化
发表于:2025-04-27 浏览:9 发布者: 网易科技
团购券写着“周一到周日可用”,周六却不能用,
团购券写着“周一到周日可用”,周六却不能用,
发表于:2025-04-05 浏览:12 发布者: 网易互联网
小米眼镜官方微博上线
小米眼镜官方微博上线
发表于:2025-02-06 浏览:19 发布者: 网易互联网
阿里国际站:欧洲市场提速法国市场订单量同比增
阿里国际站:欧洲市场提速法国市场订单量同比增
发表于:2025-03-13 浏览:14 发布者: 网易互联网
3小时爆单超500万元!这场直播如何做到“1+1>2
3小时爆单超500万元!这场直播如何做到“1+1>2
发表于:2025-05-25 浏览:7 发布者: 网易互联网
卢伟冰:预计今年小米手机销量为1.7亿台 同比多2400万
卢伟冰:预计今年小米手机销量为1.7亿台 同比多2400万
发表于:2024-11-21 浏览:33 发布者: CNMO