您的当前位置:首页>科技咨询>资讯详情

DeepSeek官方测算模型成本利润率为545%

发表于:2025-03-01 19:00:05 浏览:14次 发布者: 网易互联网

3月1日,DeepSeek官方通过社交媒体账号公布了其线上系统的实际统计数据,称如果所有tokens全部按照DeepSeek R1的定价计算,理论上成本利润率为545%。


DeepSeek官方公布,DeepSeek V3和R1的所有服务均使用H800 GPU,使用和训练一致的精度,即矩阵计算和dispatch传输采用和训练一致的FP8格式,core-attention计算和combine传输采用和训练一致的BF16,最大程度保证了服务效果。

另外,由于白天的服务负荷高,晚上的服务负荷低,因此DeepSeek实现了一套机制,在白天负荷高的时候,用所有节点部署推理服务。晚上负荷低的时候,减少推理节点,以用来做研究和训练。在最近的24小时里(北京时间 2025/02/27 12:00 至 2025/02/28 12:00),DeepSeek V3和R1推理服务占用节点总和,峰值占用为278个节点,平均占用226.75个节点(每个节点为 8 个 H800 GPU)。假定GPU租赁成本为2美金/小时,总成本为$87,072/天。


在24小时统计时段内,DeepSeek V3和R1:

输入token总数为608B,其中342B tokens(56.3%)命中KVCache硬盘缓存。 输出token总数为168B。平均输出速率为20~22 tps,平均每输出一个token的KVCache长度是4989。 平均每台H800的吞吐量为:对于prefill任务,输入吞吐约73.7k tokens/s(含缓存命中);对于decode任务,输出吞吐约14.8k tokens/s。

以上统计包括了网页、APP和API的所有负载。如果所有tokens全部按照DeepSeek R1的定价计算,理论上一天的总收入为$562,027,成本利润率545%。

DeepSeek官方表示,实际上没有这么多收入,因为V3的定价更低,同时收费服务只占了一部分,另外夜间还会有折扣。


本文系观察者网独家稿件,未经授权,不得转载。

猜你喜欢

封面科技·周报|第十二届中国网络视听大会在成
封面科技·周报|第十二届中国网络视听大会在成
发表于:2025-03-30 浏览:14 发布者: 网易互联网
DeepSeek新模型霸榜,写代码与o1相当,网友:今
DeepSeek新模型霸榜,写代码与o1相当,网友:今
发表于:2025-01-19 浏览:27 发布者: 网易互联网
受美AI芯片出口管制影响 AMD要计提8亿美元减值
受美AI芯片出口管制影响 AMD要计提8亿美元减值
发表于:2025-04-17 浏览:13 发布者: 网易IT
路畅科技申请基于出光区域的AR-HUD畸变校准方法
路畅科技申请基于出光区域的AR-HUD畸变校准方法
发表于:2024-10-28 浏览:31 发布者: 网易科技
美洲路向跨境包裹量增长迅猛,菜鸟国际快递巴西
美洲路向跨境包裹量增长迅猛,菜鸟国际快递巴西
发表于:2025-05-19 浏览:5 发布者: 网易互联网
未来黑科技申请显示调节专利,减轻视觉疲劳和视
未来黑科技申请显示调节专利,减轻视觉疲劳和视
发表于:2024-11-15 浏览:35 发布者: 网易科技
用DeepSeek直播1天卖了3.3亿!AI淘金热背后:铜
用DeepSeek直播1天卖了3.3亿!AI淘金热背后:铜
发表于:2025-03-10 浏览:13 发布者: 网易互联网
中国经济的问题,到底在哪里?
中国经济的问题,到底在哪里?
发表于:2024-10-29 浏览:31 发布者: 米筐投资
月收入暴增687%,创新社区文化,另类直播社交产
月收入暴增687%,创新社区文化,另类直播社交产
发表于:2024-11-08 浏览:35 发布者: 网易互联网
手机1%的电量能用多久?你以为要关机 结果能挺半小时
手机1%的电量能用多久?你以为要关机 结果能挺半小时
发表于:2024-10-31 浏览:54 发布者: 央视