您的当前位置:首页>科技咨询>资讯详情

DeepSeek披露,一天成本利润率为545%

发表于:2025-03-01 21:00:04 浏览:25次 发布者: 网易互联网

3月1日中午,DeepSeek在知乎平台发布首条文章,公布模型推理成本利润细节,并披露成本利润率关键信息。DeepSeek称,假定GPU租赁成本为2美元/小时,总成本为87072美元/天……统计包括网页、App和API在内的所有负载,如果所有tokens全部按照DeepSeek-R1的定价计算,理论上一天的总收入为562027美元,成本利润率为545%。

文章一经发出,不少网友纷纷在评论区@尤洋。尤洋是潞晨科技创始人。此前,尤洋公开表示,卖DeepSeek API(MaaS)每月亏本4亿元。该消息一度引起轰动。目前,尤洋已回应称,“由于多人at我,我今天(3月1日)之内会直接地回复一下”。


理论上一天的成本利润率为545%

文章中,DeepSeek首次披露成本利润率关键信息。DeepSeek统计了在24小时统计时段内DeepSeek-V3和R1网页、App和API的所有负载,所有tokens按照DeepSeek-R1的定价,并假定GPU租赁成本为2美元/小时,总成本为87072美元一天。DeepSeek称理论上一天的成本利润率为545%。

其中,DeepSeek称,在最近的24小时里(北京时间2025/02/27 12:00至2025/02/28 12:00),DeepSeek-V3和R1推理服务占用节点总和,峰值占用为278个节点,平均占用226.75个节点。DeepSeek-R1的定价为0.14美元/百万输入tokens(缓存命中),0.55美元/百万输入tokens(缓存未命中),2.19美元/百万输出tokens。

DeepSeek补充到,当然公司实际上没有这么多收入,因为V3的定价更低,同时收费服务只占了一部分,另外夜间还会有折扣。


DeepSeek表示,DeepSeek-V3/R1推理系统的优化目标是:更大的吞吐,更低的延迟。文章主要内容为如何使用EP(大规模跨节点专家并行)增大batch size(批量大小,每个batch中的样本数量),如何隐藏传输的耗时,如何进行负载均衡。


不贴钱,也不赚取暴利

此前,尤洋称,卖DeepSeek API(MaaS)每月亏本4亿元。该消息引起人们对于DeepSeek盈利话题的热议。

尤洋称,DeepSeek API(MaaS)按照2025年2月初的状态不可能盈利。亏损来源一是测试速度和实际场景的差距,二是机器利用率峰值和波谷的巨大差距,三是机器的不稳定性。

DeepSeek在最新文章中表示,白天高负荷时全节点部署推理,夜间低负荷时释放节点用于训练/研究。全天峰值278节点,平均226.75节点。业内人士表示,这疑似回应质疑,DeepSeek文章内容证明资源弹性伸缩有效,避免了资源长期空置。

关于盈利话题,DeepSeek创始人梁文锋曾公开表示,“我们只是按照自己的步调来做事,然后核算成本定价。我们的原则是不贴钱,也不赚取暴利。这个价格也是在成本之上稍微有点利润。”

去年5月,时任DeepSeek员工的罗福莉在知乎透露称,“大家不用担心模型断更,也不用担心API涨价(目前就是大规模服务的价格,不亏本,利润率超50%)”。

“这篇文章估计今年会被做在线推理和私有化部署的群转爆,因为大家可以看到他们踩的坑和让出的利润。”业内人士表示,“其实这个钱不好赚的,除非能够持续地吸引用户都来用一方的API ,持续进化模型,保持领先。”

同时,在部分业内人士看来,人工智能领域的盈利并非只考虑技术能力,商务付费能力和应用场景也极为关键。


开源周收官

此时,DeepSeek刚结束为期5天的“开源周”。

2月28日,“开源周”第五天,DeepSeek宣布开源Fire-Flyer文件系统(3FS),以及基于3FS的数据处理框架Smallpond。Fire-Flyer文件系统(3FS)是一种利用现代SSD和RDMA网络的全部带宽的并行文件系统,是所有DeepSeek数据访问的助推器。

此前,DeepSeek宣布,从2月24日起将开源5个代码库,以完全透明的方式与全球开发者社区分享他们的研究进展。

2月24日,DeepSeek启动“开源周”,开源了首个代码库FlashMLA。DeepSeek称,这是DeepSeek针对Hopper GPU优化的高效MLA解码内核,专为处理可变长度序列而设计,现在已经投入生产使用。

2月25日,DeepSeek开源了DeepEP。据介绍,这是首个用于MoE模型训练和推理的开源EP通信库,用于训练和推理的高吞吐量和低延迟。

2月26日,DeepSeek宣布开源DeepGEMM。其同时支持密集布局和两种MoE布局,完全即时编译,可为V3/R1模型的训练和推理提供强大支持等。

2月27日,DeepSeek宣布开源Optimized Parallelism Strategies。其主要针对大规模模型训练中的效率问题。

QuestMobile数据显示,自上线以来至2月9日,DeepSeek App的累计下载量已超1.1亿次,周活跃用户规模最高近9700万个。

“开源技术正从代码共享迈向实体创新,成为推动智能未来的关键力量。开源硬件为技术创新提供了自由与灵活性,而中国开源生态的发展,如DeepSeek的成功,展现了开源从‘运营驱动’向‘价值驱动’的转变。”上海开源信息技术协会秘书长朱其罡称。

来源:上海证券报 原标题《DeepSeek发文!首次披露关键信息》

⭐星标华尔街见闻,好内容不错过

本文不构成个人投资建议,不代表平台观点,市场有风险,投资需谨慎,请独立判断和决策。

觉得好看,请点“在看”

猜你喜欢

印尼电商独角兽 Bukalapak2 月 9 日关闭电商业
印尼电商独角兽 Bukalapak2 月 9 日关闭电商业
发表于:2025-02-11 浏览:35 发布者: 网易互联网
纯视觉方案,精准操控电脑和手机!港大Aria-UI
纯视觉方案,精准操控电脑和手机!港大Aria-UI
发表于:2025-01-08 浏览:49 发布者: 网易互联网
京东高薪挖人抢滩酒旅市场,国内OTA战局再添变
京东高薪挖人抢滩酒旅市场,国内OTA战局再添变
发表于:2025-06-08 浏览:24 发布者: 网易互联网
当“求好评”引发一场公共舆论战
当“求好评”引发一场公共舆论战
发表于:2025-04-17 浏览:23 发布者: 网易互联网
李彦宏:"秒哒"发布仅3天,超5000家企业排队申请测试
李彦宏:"秒哒"发布仅3天,超5000家企业排队申请测试
发表于:2024-11-20 浏览:54 发布者: 新浪科技
Meta(META.US)拟推出Oakley智能眼镜 并探索智能
Meta(META.US)拟推出Oakley智能眼镜 并探索智能
发表于:2025-01-22 浏览:37 发布者: 网易科技
阿里国际站12月GMV同比增长30%,欧洲市场增速最
阿里国际站12月GMV同比增长30%,欧洲市场增速最
发表于:2024-12-20 浏览:33 发布者: 网易互联网
阿里妈妈搜索广告2024大模型思考与实践
阿里妈妈搜索广告2024大模型思考与实践
发表于:2025-03-13 浏览:27 发布者: 网易互联网
曙光云战略发布会举办 开启从云到智的“全栈智
曙光云战略发布会举办 开启从云到智的“全栈智
发表于:2024-12-19 浏览:38 发布者: 网易互联网
快递员自曝入职京东13年税后工资累计超百万元
快递员自曝入职京东13年税后工资累计超百万元
发表于:2025-04-28 浏览:21 发布者: 网易互联网