您的当前位置:首页>科技咨询>资讯详情

DeepSeek开源第三弹:300行DeepGEMM代码

发表于:2025-02-26 12:00:15 浏览:16次 发布者: 网易互联网

三言科技 2月26日消息,DeepSeek正式启动“开源周”,将陆续开源5个代码库。前两个开源代码库分别为FlashMLA、DeepEP。

今天,DeepSeek官方推出开源第三弹:DeepGEMM。

DeepGEMM:一个支持dense和 MoE GEMM 的 FP8 GEMM 库,为 V3/R1 训练和推理提供支持。Hopper GPU 上最高可达1350+ FP8 TFLOPS。



DeepGEMM可以做到:

1、没有过多的依赖,像教程一样简洁

2、完全即时编译

3、核心逻辑约为 300 行 - 但在大多数矩阵大小上均优于专家调优的内核

4、支持dense布局和两种MoE布局

猜你喜欢

发力电商释放消费活力 2025年湖南网上年货节启
发力电商释放消费活力 2025年湖南网上年货节启
发表于:2025-01-18 浏览:24 发布者: 网易互联网
Meta反垄断案结束审理,旗下Ins和WhatsApp面临
Meta反垄断案结束审理,旗下Ins和WhatsApp面临
发表于:2025-05-28 浏览:5 发布者: 网易互联网
与辉同行抖音粉丝超东方甄选,相差4万
与辉同行抖音粉丝超东方甄选,相差4万
发表于:2025-04-25 浏览:8 发布者: 网易互联网
淘宝天猫祭出官方物流品牌“极速上门”,联合顺
淘宝天猫祭出官方物流品牌“极速上门”,联合顺
发表于:2025-06-05 浏览:5 发布者: 网易互联网
CEO锦囊·出海季:当跨境电商遇上DeepSeek,赚
CEO锦囊·出海季:当跨境电商遇上DeepSeek,赚
发表于:2025-02-26 浏览:15 发布者: 网易互联网
原????全球事务负责人入职阿尔特曼旗下团队,助力“数字身份验证”工作
原????全球事务负责人入职阿尔特曼旗下团队,助力“数字身份验证”工作
发表于:2024-11-23 浏览:37 发布者: IT之家
独家对话| 谁真正低估了Deepseek?
独家对话| 谁真正低估了Deepseek?
发表于:2025-02-24 浏览:17 发布者: 网易科技
杨元庆:没有改革开放,没有全球化,就没有今天的联想
杨元庆:没有改革开放,没有全球化,就没有今天的联想
发表于:2024-10-31 浏览:34 发布者: 睿见Economy
豆包小范围测试深度思考模型
豆包小范围测试深度思考模型
发表于:2025-02-26 浏览:17 发布者: 网易互联网
马云今日回归阿里?本人回应:没听说
马云今日回归阿里?本人回应:没听说
发表于:2025-05-10 浏览:9 发布者: 网易互联网