您的当前位置:首页>科技咨询>资讯详情

DeepSeek开源第4弹:优化的并行策略

发表于:2025-02-27 12:00:19 浏览:21次 发布者: 网易互联网

三言科技消息 刚刚DeepSeek推出开源周第4弹:优化的并行策略。


#OpenSourceWeek的第4天:优化的并行策略

DualPipe - 用于V3/R1训练中计算-通信重叠的双向管道并行算法。

EPLB - V3/R1的专家并行负载平衡器。

分析V3/R1中的计算-通信重叠。

详细介绍如下:

DualPipe(双管道并行算法)

DualPipe是DeepSeek-V3技术报告中引入的创新双向管道并行算法。它实现了正向和后向计算通信阶段的完全重叠,也减少了管道气泡。

Expert Parallelism Load Balancer (EPLB)专家并行负载平衡器

使用专家并行(EP)时,不同的专家被分配到不同的GPU。由于不同专家的负载可能因当前工作量而异,因此保持不同GPU的负载平衡很重要。正如DeepSeek-V3论文中所述,采用了冗余专家策略,复制了繁重的专家。然后,我们启发式地将重复的专家打包到GPU中,以确保不同GPU之间的负载平衡。此外,由于DeepSeek-V3中使用的组有限专家路由,我们还尝试尽可能将同一组的专家放置在同一节点上,以减少节点间数据流量。

猜你喜欢

亚马逊(AMZN.US)推出新型量子计算芯片Ocelot,
亚马逊(AMZN.US)推出新型量子计算芯片Ocelot,
发表于:2025-02-28 浏览:19 发布者: 网易互联网
站队有代价:Scale AI“卖身”Meta,惨遭谷歌“
站队有代价:Scale AI“卖身”Meta,惨遭谷歌“
发表于:2025-06-14 浏览:8 发布者: 网易IT
“机器程序员”成趋势 微软CEO称公司30%代码由A
“机器程序员”成趋势 微软CEO称公司30%代码由A
发表于:2025-04-30 浏览:12 发布者: 网易科技
天猫618手机品牌集体降价 6000元以上旗舰机型均
天猫618手机品牌集体降价 6000元以上旗舰机型均
发表于:2025-05-16 浏览:13 发布者: 网易互联网
腾讯通报:列入黑名单,永不录用!
腾讯通报:列入黑名单,永不录用!
发表于:2025-01-17 浏览:35 发布者: 网易互联网
夸大低价、卖惨营销,警惕直播带货“坑人”套路
夸大低价、卖惨营销,警惕直播带货“坑人”套路
发表于:2024-11-09 浏览:54 发布者: 网易互联网
Manus「撤出」中国,昔日AI Agent新星为何仓促
Manus「撤出」中国,昔日AI Agent新星为何仓促
发表于:2025-07-15 浏览:7 发布者: 网易互联网
智源宣布全面开源RoboBrain 2.0与RoboOS 2.0
智源宣布全面开源RoboBrain 2.0与RoboOS 2.0
发表于:2025-07-14 浏览:6 发布者: 网易互联网
快手可灵战略提级,视频大模型混战时代来了?
快手可灵战略提级,视频大模型混战时代来了?
发表于:2025-05-15 浏览:14 发布者: 网易互联网
龚宇谈爱奇艺“入场”微剧:聚焦精品、时长更短
龚宇谈爱奇艺“入场”微剧:聚焦精品、时长更短
发表于:2025-03-27 浏览:18 发布者: 网易互联网