您的当前位置:首页>科技咨询>资讯详情

DeepSeek开源第三弹:300行DeepGEMM代码

发表于:2025-02-26 12:00:15 浏览:42次 发布者: 网易互联网

三言科技 2月26日消息,DeepSeek正式启动“开源周”,将陆续开源5个代码库。前两个开源代码库分别为FlashMLA、DeepEP。

今天,DeepSeek官方推出开源第三弹:DeepGEMM。

DeepGEMM:一个支持dense和 MoE GEMM 的 FP8 GEMM 库,为 V3/R1 训练和推理提供支持。Hopper GPU 上最高可达1350+ FP8 TFLOPS。



DeepGEMM可以做到:

1、没有过多的依赖,像教程一样简洁

2、完全即时编译

3、核心逻辑约为 300 行 - 但在大多数矩阵大小上均优于专家调优的内核

4、支持dense布局和两种MoE布局

猜你喜欢

揭开平台“MCN总裁分红”骗局:分红不可能,卖
揭开平台“MCN总裁分红”骗局:分红不可能,卖
发表于:2025-05-23 浏览:29 发布者: 网易互联网
第五届中国新电商大会开幕 AI赋能新电商成焦点
第五届中国新电商大会开幕 AI赋能新电商成焦点
发表于:2025-07-27 浏览:21 发布者: 网易互联网
宇树机器人“入职”李佳琦直播间 还会“321上链
宇树机器人“入职”李佳琦直播间 还会“321上链
发表于:2025-03-09 浏览:38 发布者: 网易互联网
独家|字节TikTok算法负责人陈志杰或于近期离职
独家|字节TikTok算法负责人陈志杰或于近期离职
发表于:2024-12-24 浏览:49 发布者: 网易互联网
百度智能云:42%增速背后的“成长的烦恼”
百度智能云:42%增速背后的“成长的烦恼”
发表于:2025-06-03 浏览:31 发布者: 网易互联网
药物研发速度加快10倍!谷歌称首款AI设计药将于
药物研发速度加快10倍!谷歌称首款AI设计药将于
发表于:2025-01-22 浏览:47 发布者: 网易互联网
谷歌发布新架构,用一半内存实现推理速度翻倍
谷歌发布新架构,用一半内存实现推理速度翻倍
发表于:2025-07-17 浏览:22 发布者: 网易互联网
12月18日外媒科学网站摘要:阅读如何重塑大脑
12月18日外媒科学网站摘要:阅读如何重塑大脑
发表于:2024-12-18 浏览:81 发布者: 网易科技
得物App社区活跃创作者增长143%,83万创作者获
得物App社区活跃创作者增长143%,83万创作者获
发表于:2025-05-10 浏览:34 发布者: 网易互联网
知乎直答接入“满血版”DeepSeek-R1
发表于:2025-02-11 浏览:41 发布者: 网易互联网