您的当前位置:首页>科技咨询>资讯详情

DeepSeek“开源周”,连续掏出两大核心武器

发表于:2025-02-25 13:00:12 浏览:23次 发布者: 网易互联网

今天是DeepSeek“开源周”第二日,DeepSeek宣布开源DeepEP,第一个用于MoE模型训练和推理的开源EP通信库。

昨天,DeepSeek则开源了代码库Flash MLA,这是针对Hopper GPU优化的高效MLA解码内核,针对可变长度序列作了优化。

MoE(混合专家架构)和MLA(多头潜在注意力机制)被认为是DeepSeek以低成本实现杰出表现的核心原因。

简单理解,MoE架构是由多个专注于垂直技能的专家模型分工协作来实现最终输出结果,训练成本和推理成本更低。有消息称,GPT-4就使用了MoE架构,由8个220B模型组成。但MoE架构的缺点之一是会增加通信成本。

DeepEP通信库就是针对通信环节的优化,其特点包括:高效、优化的全员沟通;节点内和节点间均支持 NVLink 和 RDMA;用于训练和推理预填充的高吞吐量内核;用于推理解码的低延迟内核;原生 FP8 调度支持;灵活的 GPU 资源控制,实现计算-通信重叠。

MLA则是让模型预测更远位置的token,从而增强语义理解能力。DeepSeek的Flash MLA专为英伟达Hopper GPU打造了高效MLA解码内核,特别针对变长序列进行了优化。

本文系观察者网独家稿件,未经授权,不得转载。

猜你喜欢

谷歌计划与Scale AI切断联系;礼来实验性减肥药
谷歌计划与Scale AI切断联系;礼来实验性减肥药
发表于:2025-06-16 浏览:6 发布者: 网易互联网
一家充电宝公司,何以卷入“百镜大战”?
一家充电宝公司,何以卷入“百镜大战”?
发表于:2025-04-12 浏览:22 发布者: 网易科技
杭州eHub全球智慧物流枢纽开工 赋能跨境电商发
杭州eHub全球智慧物流枢纽开工 赋能跨境电商发
发表于:2024-12-28 浏览:33 发布者: 网易互联网
Qwen3技术报告公开!235B模型性能居开源模型榜
Qwen3技术报告公开!235B模型性能居开源模型榜
发表于:2025-05-14 浏览:14 发布者: 网易互联网
珠海莫界申请电池FPC测试装置及其测试方法专利
珠海莫界申请电池FPC测试装置及其测试方法专利
发表于:2025-01-15 浏览:33 发布者: 网易科技
国内智慧物流打通中东海湾六国链路,中国物流全
国内智慧物流打通中东海湾六国链路,中国物流全
发表于:2025-06-23 浏览:9 发布者: 网易互联网
绿联推出“充电宝以旧换新计划”:没3C标识的可
绿联推出“充电宝以旧换新计划”:没3C标识的可
发表于:2025-07-07 浏览:4 发布者: 网易互联网
腾讯QQ宣布:不再支持
腾讯QQ宣布:不再支持
发表于:2025-03-25 浏览:22 发布者: 网易互联网
【独家】直播吧律师回应与懂球帝App商标争议
【独家】直播吧律师回应与懂球帝App商标争议
发表于:2024-10-31 浏览:41 发布者: 网易互联网
外卖补贴大战的背后是万亿级存量的“即时零售”
外卖补贴大战的背后是万亿级存量的“即时零售”
发表于:2025-07-08 浏览:9 发布者: 网易互联网