DeepSeek官方公布成本利润率理论上可达545%

文章摘要:DeepSeek官方在3月1日通过其社交媒体账号公布了线上系统的实际统计数据,指出如果所有tokens按照DeepSeek R1的定价计算,成本利润率理论上可达545%。据DeepSeek官方透露,DeepSeek V3和R1的所有服务均采用H800 GPU,···

DeepSeek官方在3月1日通过其社交媒体账号公布了线上系统的实际统计数据,指出如果所有tokens按照DeepSeek R1的定价计算,成本利润率理论上可达545%。

4610b912c8fcc3cef30b788c0f02af87d53f2018.jpeg

据DeepSeek官方透露,DeepSeek V3和R1的所有服务均采用H800 GPU,保持一致的精度,即矩阵计算和dispatch传输采用FP8格式,core-attention计算和combine传输采用BF16格式,以确保服务效果最大化。

此外,由于白天服务负荷高,晚上负荷低,DeepSeek实施了一套机制:白天高负荷时部署所有节点进行推理服务,晚上减少节点用于研究和训练。在最近的24小时内(北京时间 2025/02/27 12:00 至 2025/02/28 12:00),DeepSeek V3和R1推理服务占用节点总数峰值为278个,平均为226.75个(每个节点配备8个H800 GPU)。假设GPU租赁成本为每小时2美元,总成本为每天$87,072。

在统计时段内,DeepSeek V3和R1的数据显示:

输入token总数为608B,其中342B tokens(56.3%)命中KVCache硬盘缓存。

输出token总数为168B,平均输出速率为20~22 tps,每输出一个token的KVCache长度为4989。

每台H800的平均吞吐量为:prefill任务输入吞吐约73.7k tokens/s(含缓存命中);decode任务输出吞吐约14.8k tokens/s。

以上统计包括网页、APP和API的所有负载。按照DeepSeek R1的定价计算,理论上一天的总收入为$562,027,成本利润率达到545%。

DeepSeek官方指出,实际收入并非如此之高,因为V3的定价更低,同时收费服务仅占一部分,夜间还有折扣优惠。

您可能还会喜欢:

文章评论

◎欢迎参与评论文章,请在这里发表您的看法、交流您的观点。