有佬能详细算算DeepSeek V4 Pro的成本吗
- 内容介绍
- 文章标签
- 相关推荐
实在想不通了,问 V4 它自己也说不清,flash还有一堆幻觉,有无业内人士从电费、硬件折旧、并发数等角度算下每百万token V4 Pro 的真实成本
网友解答:--【壹】--:
claude code工具是要做适配的,前面有过很多次缓存bug,估计deepseek的公司都不知道怎么弄,这事只有glm kimi之类的公司在搞,包括一些中转站也在搞
丝毫不调教,就按照前文对比缓存那账单得上天
你可以试试opencode,这个工具deepseek的人专门适配了
image898×700 71.9 KB
--【贰】--:
让gpt 5.5帮忙算了一下,根据vllm/sglang的部署集群和吞吐量来计算,在8*B200集群上部署,成本大概是当前官方的Token的原价,用一堆之前ds提到的infra优化,大概能做到比官方现在打折价格还便宜的水平
--【叁】--:
我看了下,V4 PRO缓存命中不高,费用其实挺贵的,我们几个小问题就去了70多,打折以后还没试过,明天周一试试
--【肆】--:
不建议使用任何官方按量付费api的方式来跑项目
在这个场景下,每轮对话的上下文都很大
这种调用方式肯定吃不消
等coding plan上线吧
--【伍】--:
最好的方式是使用一段时间,然后用中转工具统计一下额度换算
实在想不通了,问 V4 它自己也说不清,flash还有一堆幻觉,有无业内人士从电费、硬件折旧、并发数等角度算下每百万token V4 Pro 的真实成本
网友解答:--【壹】--:
claude code工具是要做适配的,前面有过很多次缓存bug,估计deepseek的公司都不知道怎么弄,这事只有glm kimi之类的公司在搞,包括一些中转站也在搞
丝毫不调教,就按照前文对比缓存那账单得上天
你可以试试opencode,这个工具deepseek的人专门适配了
image898×700 71.9 KB
--【贰】--:
让gpt 5.5帮忙算了一下,根据vllm/sglang的部署集群和吞吐量来计算,在8*B200集群上部署,成本大概是当前官方的Token的原价,用一堆之前ds提到的infra优化,大概能做到比官方现在打折价格还便宜的水平
--【叁】--:
我看了下,V4 PRO缓存命中不高,费用其实挺贵的,我们几个小问题就去了70多,打折以后还没试过,明天周一试试
--【肆】--:
不建议使用任何官方按量付费api的方式来跑项目
在这个场景下,每轮对话的上下文都很大
这种调用方式肯定吃不消
等coding plan上线吧
--【伍】--:
最好的方式是使用一段时间,然后用中转工具统计一下额度换算

