您的当前位置:首页>科技咨询>资讯详情

DeepSeek开源第二弹:EP通信库 DeepEP

发表于:2025-02-25 13:00:11 浏览:47次 发布者: 网易互联网

三言科技消息 DeepSeek正式启动“开源周”,首个开源的代码库为FlashMLA。据悉,DeepSeek本次“开源周”将陆续开源5个代码库。

今天,DeepSeek官方推出开源第二弹:首个用于MoE模型训练和推理的EP通信库 DeepEP。


DeepEP可以做到:

1. 高效优化的 All-to-All 通信

2. 支持 NVLink 和 RDMA 的节点内 / 跨节点通信

3. 训练及推理预填充阶段的高吞吐量计算核心

4. 推理解码阶段的低延迟计算核心

5. 原生支持 FP8 数据分发

6. 灵活控制 GPU 资源,实现计算与通信的高效重叠

猜你喜欢

Salesforce开源统一多模态模型BLIP3-o,图像理
Salesforce开源统一多模态模型BLIP3-o,图像理
发表于:2025-05-22 浏览:29 发布者: 网易互联网
微博智搜功能引发质疑,回应:非公开内容不会使
微博智搜功能引发质疑,回应:非公开内容不会使
发表于:2025-04-25 浏览:37 发布者: 网易互联网
于东来称该好好反思、静一下,再把抖音账号设成
于东来称该好好反思、静一下,再把抖音账号设成
发表于:2025-05-07 浏览:31 发布者: 网易互联网
济南人速看!全球首部 8K VR 大作空降弘阳,恐
济南人速看!全球首部 8K VR 大作空降弘阳,恐
发表于:2025-08-23 浏览:15 发布者: 网易科技
JCB 和 Nuvei 在亚太地区深化全球合作伙伴关系
JCB 和 Nuvei 在亚太地区深化全球合作伙伴关系
发表于:2024-11-04 浏览:55 发布者: 美通社
阿里开源首个全模态大模型,将给产业带来哪些机
阿里开源首个全模态大模型,将给产业带来哪些机
发表于:2025-03-27 浏览:35 发布者: 网易互联网
中央网信办持续加强信息推荐算法治理
中央网信办持续加强信息推荐算法治理
发表于:2025-05-22 浏览:38 发布者: 网易互联网
DeepSeek一夜把百度干回20年前,网友:还有这好
DeepSeek一夜把百度干回20年前,网友:还有这好
发表于:2025-02-24 浏览:44 发布者: 网易互联网
外卖江湖风云再起,到底谁动了谁的蛋糕?
外卖江湖风云再起,到底谁动了谁的蛋糕?
发表于:2025-04-18 浏览:31 发布者: 网易互联网
立减85折,820元大额消费券今晚可用!天猫618今
立减85折,820元大额消费券今晚可用!天猫618今
发表于:2025-05-16 浏览:28 发布者: 网易互联网