您的当前位置:首页>科技咨询>资讯详情

DeepSeek知乎披露开源周数据 理论利润率达545%

发表于:2025-03-01 17:00:03 浏览:16次 发布者: 网易互联网

来源:环球网

【环球网科技综合报道】3月1日,DeepSeek于知乎开设官方账号,独家发布《DeepSeek-V3/R1推理系统概览》技术文章,首次公布模型推理系统优化细节,并披露成本利润率关键信息,标志着全球关注的“DeepSeek开源周”正式收官。

文章写道:“DeepSeek-V3 / R1 推理系统的优化目标是:更大的吞吐,更低的延迟。”为实现这两个目标,DeepSeek的方案是使用大规模跨节点专家并行(EP),但该方案也增加了系统复杂性。文章的主要内容就是关于如何使用EP增长批量大小(batch size)、隐藏传输耗时以及进行负载均衡。


值得一提的是,文章还率先披露了DeepSeek的成本和利润率等关键信息。“假定GPU租赁成本为2美金/小时,总成本为$87,072/天。……如果所有 tokens全部按照DeepSeek R1的定价计算,理论上一天的总收入为$562,027,成本利润率545%。”

据了解,“DeepSeek开源周”自2月24日至2月28日,陆续开源最新技术进展。其中包括,FlashMLA、DeepEP、DeepGEMM和3FS四个开源项目,以及DualPipe、EPLB等代码库。每一项开源发布,都在知乎引发了业内人士的热烈讨论和赞叹。

“话不多说,DeepSeek和OpenAI一样重要。”知乎大模型话题优秀答主、算法工程师“刘聪NPL”如此评价。业内人士甚至认为,“DeepSeek开源周”的重要性已经超过了不久前OpenAI的发布会。DeepSeek用“量大管饱”的开源有力回击了欧美关于DeepSeek故意说低训练成本的说法,并且证明了在训练链路上存在极大的优化空间。“刘聪NPL”在开源周最后一天就感叹:“真没想到,最后一天DeepSeek对存储下手啊!”而知乎编程话题优秀答主“平凡”在第三天就做出判断:“这些工作几乎不可能在国外的AI公司里面完成。”(勃潺)

猜你喜欢

专访李佳琦:不担心被AI取代
专访李佳琦:不担心被AI取代
发表于:2025-03-13 浏览:13 发布者: 网易互联网
腾讯元宝发布电脑版,为工作和学习场景提效
腾讯元宝发布电脑版,为工作和学习场景提效
发表于:2025-03-02 浏览:16 发布者: 网易互联网
突然,微软宣布Skype将关闭!
突然,微软宣布Skype将关闭!
发表于:2025-03-02 浏览:14 发布者: 网易互联网
百度地图客服回应植入广告:已记录问题
百度地图客服回应植入广告:已记录问题
发表于:2025-05-09 浏览:9 发布者: 网易互联网
谷歌 Tensor G5 芯片跑分曝光:1+5+2 集群设计、升级 GPU
谷歌 Tensor G5 芯片跑分曝光:1+5+2 集群设计、升级 GPU
发表于:2024-11-02 浏览:29 发布者: 网易新闻
百度李彦宏:文心大模型4.5系列将开源,是最强
百度李彦宏:文心大模型4.5系列将开源,是最强
发表于:2025-02-18 浏览:22 发布者: 网易互联网
DeepSeek登顶中美App Store,独有的深度思考+联
DeepSeek登顶中美App Store,独有的深度思考+联
发表于:2025-01-27 浏览:20 发布者: 网易互联网
从0到1,杭州为科创企业奉上“保姆级攻略”!
从0到1,杭州为科创企业奉上“保姆级攻略”!
发表于:2025-03-28 浏览:11 发布者: 网易互联网
成都无人配送车越来越多:快递员不怕“抢饭碗”
成都无人配送车越来越多:快递员不怕“抢饭碗”
发表于:2025-02-10 浏览:19 发布者: 网易互联网
天猫618海外会场商家近百万,运动鞋、奶粉等多
天猫618海外会场商家近百万,运动鞋、奶粉等多
发表于:2025-05-21 浏览:7 发布者: 网易互联网