FOXCODE的缓存命中率低的有点可怕哦,怪不得额度消耗快!
- 内容介绍
- 文章标签
- 相关推荐
实际使用花的钱,下面有对比~
image870×1107 35.7 KB
image845×852 20.6 KB
image1191×454 49.1 KB
image990×457 29 KB
使用场景vs code(claude扩展)
| 统计维度 (103次连续对话) | 实际发生数据 (包含频繁断连) | 理论应有数据 (无异常断连) | 偏差差值 |
|---|---|---|---|
| 强制未命中 (断连并需重新创建缓存) 的次数 | 27 次 | 只有首轮 1 次 (其余全继承) | 多出 26 次强制断连 |
| 强制未命中率 / 惩罚率 | 26.10% | 约 5% 内 | + 21.1% 额外重建频率 |
| 被计为全价 Cache Write ($6.25) 的 Token 量 | 4,325,533 | 约 839,610 (其余应落入 $0.5) | 多出 3,485,923 个 Token 被计费 |
| 产生的总计额度费用 (FOX 额度刀) | $33.99 | 约 $13.96 | 多扣除 $20.03 刀额度 |
| 转换为实际付出的人民币 (×0.54汇率) | ¥ 18.35 元 | 约 ¥ 7.54 元 | 多 ¥ 10.81 元 |
“135块钱 等于250刀” 计算公式:135 ÷ 250 = 0.54。
| 输入 | 输出 | 缓存命中 | 缓存创建 |
|---|---|---|---|
| 3472 | 28324 | 12463199 | 4325533 |
- 未命中缓存次数: 27
- 未命中百分百: 26.10%
大家注意,OpenRouter 官方显示的缓存率其实是有大量单次、不连续的请求给拉低的。对于我们在 VS Code, code cli这种连贯开发的场景,可以回去看一眼自己平时的XXXX日志,真实的稳定命中率是大于很多OpenRouter 参考值的。
PS:最近GPT撸得多,看GPT的缓存命中率就有数了。
总结:算下来,大家在实际使用它的过程中,最好抱着大概多承担大概费用*2.4支出的心理准备去用。
提示:各位在使用需要连续会话的场景,最好关注缓存命中率,这才是账单杀手~
网友解答:--【壹】--:
60% 的命中率,分组应该是在0.16倍。目前所有的中转站贵,只谈分组倍率,不谈命中率。
--【贰】--:
插眼吃瓜
另外佬,fox家的kiro逆向不是挂了吗
--【叁】--:
我之前看NEW-API 是有缓存+会话的粘黏的
这个技术应该说是成熟的,没有啥讨论的,包括CLI Proxy API ~Antigravity Tools都有类似的功能
--【肆】--: bozarzza:
强制未命中率 / 惩罚率 26.10% 约 5% 内 + 21.1% 额外重建频率 被计为全价 Cache Write ($6.25) 的 Token 量 4,325,533 约 839,610 (其余应落入 $0.5) 多出 3,485,92
这两行理论值想请教一下怎么算
--【伍】--: 【让成本透明化,卖的安心,买的放心】我应该在0.34元/刀的基础上,加价多少给富可敌国?新的一年,我不想再用三色图选中转了 搞七捻三
TL;DR 买中转三步走 去群里/找商家问最近一周他们opus4.6的缓存命中有多少?低于80%直接抬走下一位,双赢的事我不明白除了想躺着挣钱,还有什么理由不研究缓存技术。 找状态页/直接在群里问问,看看他们这一周的稳定性,确保你购买的月卡有机会用满。 找个能算明白账,知道自己挣得是用户的什么钱的商家。 以上都走不通就买小额(固定充值),自己实测一周,不要为了贪月卡那个看起来很低的单价而冲动消费…
佬友看这个
--【陆】--:
基于现有的数据来的呀,你指的是哪一项呢?
--【柒】--:
如果Kiro的話,本身沒有緩存,現在看到的緩存應該是模擬出來的;
如果是max 渠道,有可能是途中切換號時丟失緩存,所以要重建;
緩存優化要么盡量不換號,要么特地切號重建不計費,但目前應該沒幾家會這么干,以前又一家open前綴的有優化,可惜後來沒了
--【捌】--:
插个眼吃瓜
--【玖】--:
缓存命中啥意思呀,什么情况才会缓存,什么情况才会被命中呀
--【拾】--:
aws的话似乎没有缓存一说吧,好吧,这个好像一直有吐槽的
--【拾壹】--:
其他家什么价格,比fox贵还是比fox便宜
--【拾贰】--:
有点离谱,这个缓存。
--【拾叁】--:
kiro 云厂商上游肯定有缓存,只是他并不是 claude api 协议的前缀匹配,是基于会话的隐式缓存,具体没有公布。
--【拾肆】--:
我不想聊什么渠道上游的事情,我补充一点,官方订阅并没有收缓存的钱吧?如果是MAX渠道,哪儿来的缓存费用呢?
--【拾伍】--:
突然想起来,各位可以看看我的日志截图里面的首响,可以看出一点秘密哦
--【拾陆】--:
这么离谱吗
--【拾柒】--:
大佬好强
请教一下那个对比用的理论值是怎么得来的?
--【拾捌】--:
我又编辑了一下~
--【拾玖】--:
问了一个hi,没了0.5。
实际使用花的钱,下面有对比~
image870×1107 35.7 KB
image845×852 20.6 KB
image1191×454 49.1 KB
image990×457 29 KB
使用场景vs code(claude扩展)
| 统计维度 (103次连续对话) | 实际发生数据 (包含频繁断连) | 理论应有数据 (无异常断连) | 偏差差值 |
|---|---|---|---|
| 强制未命中 (断连并需重新创建缓存) 的次数 | 27 次 | 只有首轮 1 次 (其余全继承) | 多出 26 次强制断连 |
| 强制未命中率 / 惩罚率 | 26.10% | 约 5% 内 | + 21.1% 额外重建频率 |
| 被计为全价 Cache Write ($6.25) 的 Token 量 | 4,325,533 | 约 839,610 (其余应落入 $0.5) | 多出 3,485,923 个 Token 被计费 |
| 产生的总计额度费用 (FOX 额度刀) | $33.99 | 约 $13.96 | 多扣除 $20.03 刀额度 |
| 转换为实际付出的人民币 (×0.54汇率) | ¥ 18.35 元 | 约 ¥ 7.54 元 | 多 ¥ 10.81 元 |
“135块钱 等于250刀” 计算公式:135 ÷ 250 = 0.54。
| 输入 | 输出 | 缓存命中 | 缓存创建 |
|---|---|---|---|
| 3472 | 28324 | 12463199 | 4325533 |
- 未命中缓存次数: 27
- 未命中百分百: 26.10%
大家注意,OpenRouter 官方显示的缓存率其实是有大量单次、不连续的请求给拉低的。对于我们在 VS Code, code cli这种连贯开发的场景,可以回去看一眼自己平时的XXXX日志,真实的稳定命中率是大于很多OpenRouter 参考值的。
PS:最近GPT撸得多,看GPT的缓存命中率就有数了。
总结:算下来,大家在实际使用它的过程中,最好抱着大概多承担大概费用*2.4支出的心理准备去用。
提示:各位在使用需要连续会话的场景,最好关注缓存命中率,这才是账单杀手~
网友解答:--【壹】--:
60% 的命中率,分组应该是在0.16倍。目前所有的中转站贵,只谈分组倍率,不谈命中率。
--【贰】--:
插眼吃瓜
另外佬,fox家的kiro逆向不是挂了吗
--【叁】--:
我之前看NEW-API 是有缓存+会话的粘黏的
这个技术应该说是成熟的,没有啥讨论的,包括CLI Proxy API ~Antigravity Tools都有类似的功能
--【肆】--: bozarzza:
强制未命中率 / 惩罚率 26.10% 约 5% 内 + 21.1% 额外重建频率 被计为全价 Cache Write ($6.25) 的 Token 量 4,325,533 约 839,610 (其余应落入 $0.5) 多出 3,485,92
这两行理论值想请教一下怎么算
--【伍】--: 【让成本透明化,卖的安心,买的放心】我应该在0.34元/刀的基础上,加价多少给富可敌国?新的一年,我不想再用三色图选中转了 搞七捻三
TL;DR 买中转三步走 去群里/找商家问最近一周他们opus4.6的缓存命中有多少?低于80%直接抬走下一位,双赢的事我不明白除了想躺着挣钱,还有什么理由不研究缓存技术。 找状态页/直接在群里问问,看看他们这一周的稳定性,确保你购买的月卡有机会用满。 找个能算明白账,知道自己挣得是用户的什么钱的商家。 以上都走不通就买小额(固定充值),自己实测一周,不要为了贪月卡那个看起来很低的单价而冲动消费…
佬友看这个
--【陆】--:
基于现有的数据来的呀,你指的是哪一项呢?
--【柒】--:
如果Kiro的話,本身沒有緩存,現在看到的緩存應該是模擬出來的;
如果是max 渠道,有可能是途中切換號時丟失緩存,所以要重建;
緩存優化要么盡量不換號,要么特地切號重建不計費,但目前應該沒幾家會這么干,以前又一家open前綴的有優化,可惜後來沒了
--【捌】--:
插个眼吃瓜
--【玖】--:
缓存命中啥意思呀,什么情况才会缓存,什么情况才会被命中呀
--【拾】--:
aws的话似乎没有缓存一说吧,好吧,这个好像一直有吐槽的
--【拾壹】--:
其他家什么价格,比fox贵还是比fox便宜
--【拾贰】--:
有点离谱,这个缓存。
--【拾叁】--:
kiro 云厂商上游肯定有缓存,只是他并不是 claude api 协议的前缀匹配,是基于会话的隐式缓存,具体没有公布。
--【拾肆】--:
我不想聊什么渠道上游的事情,我补充一点,官方订阅并没有收缓存的钱吧?如果是MAX渠道,哪儿来的缓存费用呢?
--【拾伍】--:
突然想起来,各位可以看看我的日志截图里面的首响,可以看出一点秘密哦
--【拾陆】--:
这么离谱吗
--【拾柒】--:
大佬好强
请教一下那个对比用的理论值是怎么得来的?
--【拾捌】--:
我又编辑了一下~
--【拾玖】--:
问了一个hi,没了0.5。

