claude code为什么这么费token呀,一次调用40w是正常情况吗

2026-04-11 15:131阅读0评论SEO教程
  • 内容介绍
  • 文章标签
  • 相关推荐
问题描述:

小白刚开始使用claude code,通过cc switch接入了硅基流动的Kimi和minimax模型。

在第一次对话,无skill、无claude.md的情况下,我让cc接入github仓库下载claudian插件,我看一个命令调用了七八次api,最多的一次花了差不多40w token。

有点被惊到了,这还只是一个简单的下载唉。下载claudian,下载了官方的4个skill,就算用的是最便宜的minimax的情况下还是花了四五块钱吧。

然后看过程,cc先用web fetch失败了,再用gh失败(估计是我没配置),最后用的curl下载的,不知道是不是token高的原因。用国产模型连github等外网就是会出现这些失败吗?需不需要安装个联网搜索的skill呢(我本地开着梯子)

网友解答:
--【壹】--:

40W太正常了吧


--【贰】--:

没有命中缓存吧,Claude Code的缓存生命周期是5分钟,5分钟内没发新消息缓存就过期了。上下文重新来过


--【叁】--:

image1083×474 18.7 KB是400k吧?但我发现这个是不是就是缓存命中啊……


--【肆】--:

kimi 和 minimax 最大不是 200k 上下文,也就是 20w tokens 吗


--【伍】--:

没有对话历史,是我配置好cc以后的第一次对话


--【陆】--:

模型调用命令的终端要挂梯子,你本地挂梯子没用


--【柒】--:

但是也能连上github,用web fetch不行,curl可以


--【捌】--:

这么说我也很疑惑了,我看的是硅基流动的后台计费


--【玖】--:

cc只推荐使用anthropic的官方服务,不推荐接入其他第三方服务


--【拾】--:

不是, 是不是多看了一位, 40w是400k吧, 这俩模型怎么做到超过自己上下文的

另外, 如果没有缓存确实挺烧的, 毕竟cc本来内置的工具说明就大概20k这样?

如果少一位, 40k一次就挺正常了

有缓存的话就只有增量了


--【拾壹】--:

哦哦是这个意思,不好意思佬截不了图了,刚重装了系统,没保存配置,要重新配置CC了 大概就是我发了claudian的github链接,让他下载下来,然后先webfetch失败,gh失败,换curl,查目录,查readme文档,下载,这么几步


--【拾贰】--:

大部分是缓存token,正常


--【拾叁】--:

对话历史呢~


--【拾肆】--:

我的意思就是内容截个图
不然云里雾里的 只能猜


--【拾伍】--:

40w只是一次命令中的一次调用唉,实际上把claudian下载下来这一个命令好像总共花了上百万的

问题描述:

小白刚开始使用claude code,通过cc switch接入了硅基流动的Kimi和minimax模型。

在第一次对话,无skill、无claude.md的情况下,我让cc接入github仓库下载claudian插件,我看一个命令调用了七八次api,最多的一次花了差不多40w token。

有点被惊到了,这还只是一个简单的下载唉。下载claudian,下载了官方的4个skill,就算用的是最便宜的minimax的情况下还是花了四五块钱吧。

然后看过程,cc先用web fetch失败了,再用gh失败(估计是我没配置),最后用的curl下载的,不知道是不是token高的原因。用国产模型连github等外网就是会出现这些失败吗?需不需要安装个联网搜索的skill呢(我本地开着梯子)

网友解答:
--【壹】--:

40W太正常了吧


--【贰】--:

没有命中缓存吧,Claude Code的缓存生命周期是5分钟,5分钟内没发新消息缓存就过期了。上下文重新来过


--【叁】--:

image1083×474 18.7 KB是400k吧?但我发现这个是不是就是缓存命中啊……


--【肆】--:

kimi 和 minimax 最大不是 200k 上下文,也就是 20w tokens 吗


--【伍】--:

没有对话历史,是我配置好cc以后的第一次对话


--【陆】--:

模型调用命令的终端要挂梯子,你本地挂梯子没用


--【柒】--:

但是也能连上github,用web fetch不行,curl可以


--【捌】--:

这么说我也很疑惑了,我看的是硅基流动的后台计费


--【玖】--:

cc只推荐使用anthropic的官方服务,不推荐接入其他第三方服务


--【拾】--:

不是, 是不是多看了一位, 40w是400k吧, 这俩模型怎么做到超过自己上下文的

另外, 如果没有缓存确实挺烧的, 毕竟cc本来内置的工具说明就大概20k这样?

如果少一位, 40k一次就挺正常了

有缓存的话就只有增量了


--【拾壹】--:

哦哦是这个意思,不好意思佬截不了图了,刚重装了系统,没保存配置,要重新配置CC了 大概就是我发了claudian的github链接,让他下载下来,然后先webfetch失败,gh失败,换curl,查目录,查readme文档,下载,这么几步


--【拾贰】--:

大部分是缓存token,正常


--【拾叁】--:

对话历史呢~


--【拾肆】--:

我的意思就是内容截个图
不然云里雾里的 只能猜


--【拾伍】--:

40w只是一次命令中的一次调用唉,实际上把claudian下载下来这一个命令好像总共花了上百万的