您的当前位置:首页>科技咨询>资讯详情

DeepSeek开源第三弹:300行DeepGEMM代码

发表于:2025-02-26 12:00:15 浏览:23次 发布者: 网易互联网

三言科技 2月26日消息,DeepSeek正式启动“开源周”,将陆续开源5个代码库。前两个开源代码库分别为FlashMLA、DeepEP。

今天,DeepSeek官方推出开源第三弹:DeepGEMM。

DeepGEMM:一个支持dense和 MoE GEMM 的 FP8 GEMM 库,为 V3/R1 训练和推理提供支持。Hopper GPU 上最高可达1350+ FP8 TFLOPS。



DeepGEMM可以做到:

1、没有过多的依赖,像教程一样简洁

2、完全即时编译

3、核心逻辑约为 300 行 - 但在大多数矩阵大小上均优于专家调优的内核

4、支持dense布局和两种MoE布局

猜你喜欢

叶国富:占领欧美制高地是打造国际化品牌最重要的一步
叶国富:占领欧美制高地是打造国际化品牌最重要的一步
发表于:2024-11-02 浏览:41 发布者: 新浪科技
淘宝已成为2025年春晚独家电商互动平台
淘宝已成为2025年春晚独家电商互动平台
发表于:2025-01-18 浏览:31 发布者: 网易互联网
爱奇艺已履行法院判决,原告获41天会员补偿
爱奇艺已履行法院判决,原告获41天会员补偿
发表于:2024-11-08 浏览:44 发布者: 网易互联网
单向VLM变双向!人大斯坦福等提出MoCa框架:双
单向VLM变双向!人大斯坦福等提出MoCa框架:双
发表于:2025-07-10 浏览:7 发布者: 网易互联网
虽然“红猫”上线了,但小红书的赚钱逻辑还在继
虽然“红猫”上线了,但小红书的赚钱逻辑还在继
发表于:2025-05-09 浏览:17 发布者: 网易互联网
TikTok20日已恢复在美服务;京东物流、顺丰大手
TikTok20日已恢复在美服务;京东物流、顺丰大手
发表于:2025-01-27 浏览:31 发布者: 网易互联网
1688的2025如何走?加码出海与AI应用提速
1688的2025如何走?加码出海与AI应用提速
发表于:2025-02-12 浏览:30 发布者: 网易互联网
ChatGPT推出会议记录模式,并支持MCP协议
ChatGPT推出会议记录模式,并支持MCP协议
发表于:2025-06-05 浏览:16 发布者: 网易互联网
速卖通英国站开通小时达服务
速卖通英国站开通小时达服务
发表于:2025-07-10 浏览:5 发布者: 网易互联网
上海外卖平台仍有少量“0元购”,监管部门回应
上海外卖平台仍有少量“0元购”,监管部门回应
发表于:2025-07-23 浏览:1 发布者: 网易互联网