FOXCODE的缓存命中率低的有点可怕哦,怪不得额度消耗快!

2026-04-11 14:061阅读0评论SEO资源
  • 内容介绍
  • 文章标签
  • 相关推荐
问题描述:

实际使用花的钱,下面有对比~

image870×1107 35.7 KB
image845×852 20.6 KB
image1191×454 49.1 KB

image990×457 29 KB

使用场景vs code(claude扩展)

统计维度 (103次连续对话) 实际发生数据 (包含频繁断连) 理论应有数据 (无异常断连) 偏差差值
强制未命中 (断连并需重新创建缓存) 的次数 27 次 只有首轮 1 次 (其余全继承) 多出 26 次强制断连
强制未命中率 / 惩罚率 26.10% 约 5% 内 + 21.1% 额外重建频率
被计为全价 Cache Write ($6.25) 的 Token 量 4,325,533 约 839,610 (其余应落入 $0.5) 多出 3,485,923 个 Token 被计费
产生的总计额度费用 (FOX 额度刀) $33.99 约 $13.96 多扣除 $20.03 刀额度
转换为实际付出的人民币 (×0.54汇率) ¥ 18.35 元 约 ¥ 7.54 元 多 ¥ 10.81 元

“135块钱 等于250刀” 计算公式:135 ÷ 250 = 0.54。

输入 输出 缓存命中 缓存创建
3472 28324 12463199 4325533
  • 未命中缓存次数: 27
  • 未命中百分百: 26.10%

大家注意,OpenRouter 官方显示的缓存率其实是有大量单次、不连续的请求给拉低的。对于我们在 VS Code, code cli这种连贯开发的场景,可以回去看一眼自己平时的XXXX日志,真实的稳定命中率是大于很多OpenRouter 参考值的。
PS:最近GPT撸得多,看GPT的缓存命中率就有数了。

总结:算下来,大家在实际使用它的过程中,最好抱着大概多承担大概费用*2.4支出的心理准备去用。

提示:各位在使用需要连续会话的场景,最好关注缓存命中率,这才是账单杀手~

网友解答:
--【壹】--:

60% 的命中率,分组应该是在0.16倍。目前所有的中转站贵,只谈分组倍率,不谈命中率。


--【贰】--:

插眼吃瓜
另外佬,fox家的kiro逆向不是挂了吗


--【叁】--:

我之前看NEW-API 是有缓存+会话的粘黏的
这个技术应该说是成熟的,没有啥讨论的,包括CLI Proxy API ~Antigravity Tools都有类似的功能


--【肆】--: bozarzza:

强制未命中率 / 惩罚率 26.10% 约 5% 内 + 21.1% 额外重建频率 被计为全价 Cache Write ($6.25) 的 Token 量 4,325,533 约 839,610 (其余应落入 $0.5) 多出 3,485,92

这两行理论值想请教一下怎么算


--【伍】--: 【让成本透明化,卖的安心,买的放心】我应该在0.34元/刀的基础上,加价多少给富可敌国?新的一年,我不想再用三色图选中转了 搞七捻三
TL;DR 买中转三步走 去群里/找商家问最近一周他们opus4.6的缓存命中有多少?低于80%直接抬走下一位,双赢的事我不明白除了想躺着挣钱,还有什么理由不研究缓存技术。 找状态页/直接在群里问问,看看他们这一周的稳定性,确保你购买的月卡有机会用满。 找个能算明白账,知道自己挣得是用户的什么钱的商家。 以上都走不通就买小额(固定充值),自己实测一周,不要为了贪月卡那个看起来很低的单价而冲动消费…

佬友看这个


--【陆】--:

基于现有的数据来的呀,你指的是哪一项呢?


--【柒】--:

如果Kiro的話,本身沒有緩存,現在看到的緩存應該是模擬出來的;

如果是max 渠道,有可能是途中切換號時丟失緩存,所以要重建;

緩存優化要么盡量不換號,要么特地切號重建不計費,但目前應該沒幾家會這么干,以前又一家open前綴的有優化,可惜後來沒了


--【捌】--:

插个眼吃瓜


--【玖】--:

缓存命中啥意思呀,什么情况才会缓存,什么情况才会被命中呀


--【拾】--:

aws的话似乎没有缓存一说吧,好吧,这个好像一直有吐槽的


--【拾壹】--:

其他家什么价格,比fox贵还是比fox便宜


--【拾贰】--:

有点离谱,这个缓存。


--【拾叁】--:

kiro 云厂商上游肯定有缓存,只是他并不是 claude api 协议的前缀匹配,是基于会话的隐式缓存,具体没有公布。


--【拾肆】--:

我不想聊什么渠道上游的事情,我补充一点,官方订阅并没有收缓存的钱吧?如果是MAX渠道,哪儿来的缓存费用呢?


--【拾伍】--:

突然想起来,各位可以看看我的日志截图里面的首响,可以看出一点秘密哦


--【拾陆】--:

这么离谱吗


--【拾柒】--:

大佬好强

请教一下那个对比用的理论值是怎么得来的?


--【拾捌】--:

我又编辑了一下~


--【拾玖】--:

问了一个hi,没了0.5。

标签:人工智能
问题描述:

实际使用花的钱,下面有对比~

image870×1107 35.7 KB
image845×852 20.6 KB
image1191×454 49.1 KB

image990×457 29 KB

使用场景vs code(claude扩展)

统计维度 (103次连续对话) 实际发生数据 (包含频繁断连) 理论应有数据 (无异常断连) 偏差差值
强制未命中 (断连并需重新创建缓存) 的次数 27 次 只有首轮 1 次 (其余全继承) 多出 26 次强制断连
强制未命中率 / 惩罚率 26.10% 约 5% 内 + 21.1% 额外重建频率
被计为全价 Cache Write ($6.25) 的 Token 量 4,325,533 约 839,610 (其余应落入 $0.5) 多出 3,485,923 个 Token 被计费
产生的总计额度费用 (FOX 额度刀) $33.99 约 $13.96 多扣除 $20.03 刀额度
转换为实际付出的人民币 (×0.54汇率) ¥ 18.35 元 约 ¥ 7.54 元 多 ¥ 10.81 元

“135块钱 等于250刀” 计算公式:135 ÷ 250 = 0.54。

输入 输出 缓存命中 缓存创建
3472 28324 12463199 4325533
  • 未命中缓存次数: 27
  • 未命中百分百: 26.10%

大家注意,OpenRouter 官方显示的缓存率其实是有大量单次、不连续的请求给拉低的。对于我们在 VS Code, code cli这种连贯开发的场景,可以回去看一眼自己平时的XXXX日志,真实的稳定命中率是大于很多OpenRouter 参考值的。
PS:最近GPT撸得多,看GPT的缓存命中率就有数了。

总结:算下来,大家在实际使用它的过程中,最好抱着大概多承担大概费用*2.4支出的心理准备去用。

提示:各位在使用需要连续会话的场景,最好关注缓存命中率,这才是账单杀手~

网友解答:
--【壹】--:

60% 的命中率,分组应该是在0.16倍。目前所有的中转站贵,只谈分组倍率,不谈命中率。


--【贰】--:

插眼吃瓜
另外佬,fox家的kiro逆向不是挂了吗


--【叁】--:

我之前看NEW-API 是有缓存+会话的粘黏的
这个技术应该说是成熟的,没有啥讨论的,包括CLI Proxy API ~Antigravity Tools都有类似的功能


--【肆】--: bozarzza:

强制未命中率 / 惩罚率 26.10% 约 5% 内 + 21.1% 额外重建频率 被计为全价 Cache Write ($6.25) 的 Token 量 4,325,533 约 839,610 (其余应落入 $0.5) 多出 3,485,92

这两行理论值想请教一下怎么算


--【伍】--: 【让成本透明化,卖的安心,买的放心】我应该在0.34元/刀的基础上,加价多少给富可敌国?新的一年,我不想再用三色图选中转了 搞七捻三
TL;DR 买中转三步走 去群里/找商家问最近一周他们opus4.6的缓存命中有多少?低于80%直接抬走下一位,双赢的事我不明白除了想躺着挣钱,还有什么理由不研究缓存技术。 找状态页/直接在群里问问,看看他们这一周的稳定性,确保你购买的月卡有机会用满。 找个能算明白账,知道自己挣得是用户的什么钱的商家。 以上都走不通就买小额(固定充值),自己实测一周,不要为了贪月卡那个看起来很低的单价而冲动消费…

佬友看这个


--【陆】--:

基于现有的数据来的呀,你指的是哪一项呢?


--【柒】--:

如果Kiro的話,本身沒有緩存,現在看到的緩存應該是模擬出來的;

如果是max 渠道,有可能是途中切換號時丟失緩存,所以要重建;

緩存優化要么盡量不換號,要么特地切號重建不計費,但目前應該沒幾家會這么干,以前又一家open前綴的有優化,可惜後來沒了


--【捌】--:

插个眼吃瓜


--【玖】--:

缓存命中啥意思呀,什么情况才会缓存,什么情况才会被命中呀


--【拾】--:

aws的话似乎没有缓存一说吧,好吧,这个好像一直有吐槽的


--【拾壹】--:

其他家什么价格,比fox贵还是比fox便宜


--【拾贰】--:

有点离谱,这个缓存。


--【拾叁】--:

kiro 云厂商上游肯定有缓存,只是他并不是 claude api 协议的前缀匹配,是基于会话的隐式缓存,具体没有公布。


--【拾肆】--:

我不想聊什么渠道上游的事情,我补充一点,官方订阅并没有收缓存的钱吧?如果是MAX渠道,哪儿来的缓存费用呢?


--【拾伍】--:

突然想起来,各位可以看看我的日志截图里面的首响,可以看出一点秘密哦


--【拾陆】--:

这么离谱吗


--【拾柒】--:

大佬好强

请教一下那个对比用的理论值是怎么得来的?


--【拾捌】--:

我又编辑了一下~


--【拾玖】--:

问了一个hi,没了0.5。

标签:人工智能