您的当前位置:首页>科技咨询>资讯详情

DeepSeek“开源周”,连续掏出两大核心武器

发表于:2025-02-25 13:00:12 浏览:35次 发布者: 网易互联网

今天是DeepSeek“开源周”第二日,DeepSeek宣布开源DeepEP,第一个用于MoE模型训练和推理的开源EP通信库。

昨天,DeepSeek则开源了代码库Flash MLA,这是针对Hopper GPU优化的高效MLA解码内核,针对可变长度序列作了优化。

MoE(混合专家架构)和MLA(多头潜在注意力机制)被认为是DeepSeek以低成本实现杰出表现的核心原因。

简单理解,MoE架构是由多个专注于垂直技能的专家模型分工协作来实现最终输出结果,训练成本和推理成本更低。有消息称,GPT-4就使用了MoE架构,由8个220B模型组成。但MoE架构的缺点之一是会增加通信成本。

DeepEP通信库就是针对通信环节的优化,其特点包括:高效、优化的全员沟通;节点内和节点间均支持 NVLink 和 RDMA;用于训练和推理预填充的高吞吐量内核;用于推理解码的低延迟内核;原生 FP8 调度支持;灵活的 GPU 资源控制,实现计算-通信重叠。

MLA则是让模型预测更远位置的token,从而增强语义理解能力。DeepSeek的Flash MLA专为英伟达Hopper GPU打造了高效MLA解码内核,特别针对变长序列进行了优化。

本文系观察者网独家稿件,未经授权,不得转载。

猜你喜欢

PICO 开放生态升级,全面支持个人开发者入驻
PICO 开放生态升级,全面支持个人开发者入驻
发表于:2025-04-22 浏览:29 发布者: 网易科技
OpenAI新推理模型被曝产生更多幻觉;Meta旗下AP
OpenAI新推理模型被曝产生更多幻觉;Meta旗下AP
发表于:2025-04-21 浏览:26 发布者: 网易科技
苹果Safari要出AI搜索新招!谷歌市值蒸发1500亿
苹果Safari要出AI搜索新招!谷歌市值蒸发1500亿
发表于:2025-05-08 浏览:31 发布者: 网易IT
DeepSeek重返韩国!暂停两个多月后恢复下载
DeepSeek重返韩国!暂停两个多月后恢复下载
发表于:2025-04-29 浏览:30 发布者: 网易IT
AlipayHK:推出AI智能助理 率先将DeepSeek嵌入
AlipayHK:推出AI智能助理 率先将DeepSeek嵌入
发表于:2025-03-03 浏览:34 发布者: 网易互联网
文心一言启动退费操作,付费会员可享部分退款
文心一言启动退费操作,付费会员可享部分退款
发表于:2025-02-13 浏览:31 发布者: 网易互联网
外媒:中国推动在电动汽车中使用国产芯片
外媒:中国推动在电动汽车中使用国产芯片
发表于:2025-01-02 浏览:39 发布者: 网易IT
DeepSeek V3.1 发布:更强的 Agent ,更贵的 AP
DeepSeek V3.1 发布:更强的 Agent ,更贵的 AP
发表于:2025-08-22 浏览:9 发布者: 网易互联网
双十一 VR / AR 产品选购推荐:HTC VIVE XR 精
双十一 VR / AR 产品选购推荐:HTC VIVE XR 精
发表于:2024-10-31 浏览:46 发布者: 网易科技
坐上电商市场第三把交椅? 抖音“后来居上”不
坐上电商市场第三把交椅? 抖音“后来居上”不
发表于:2025-02-27 浏览:35 发布者: 网易互联网