火山的 Coding Plan 上了 GLM-5.1 和 K2.6，不过貌似还没有缓存，计费爆炸

2026-04-29 09:303阅读0评论SEO问题

内容介绍
文章标签
相关推荐

问题描述：

他家的coding plan和glm类似，是按照token计费的

但是刚才试了一下，好像是没有缓存的，所以计费爆炸，限额跑的飞快

不知道会不会修一下，没有缓存字节也血亏吧

网友解答：

--【壹】--：

能正常用的话，性价比无敌了吧，国产三巨头新模型都上了

--【贰】--：

会不会是分的卡太少了，不加缓存反而比加缓存跑得快，毕竟缓存要显存的。

--【叁】--：

火山上的是量化版的5.1吗？之前有说不是满血的

--【肆】--：

这样嘛，那我是真觉得火山的coding plan有点拉了。我记得2月过年前后，火山的客服给我打电话还问我用起来有啥问题，它和我说lite会专门限制并发来着

--【伍】--：

火山的tps慢的想死，开了俩月lite给我折磨死了，不知道贵一档的tps能不能好点。也不知道是不是上的第三方模型背后都是量化过的，体感比其他地方的蠢一些

--【陆】--：

巨拉巨拉巨拉巨拉，我的评价是把钱扔了都不要去买他们家，扔了我至少不生气。但凡看见火山的帖子我都得进来骂两句，太气人了

--【柒】--：

如果有缓存的话，这个coding plan就很强了

现在没有缓存跑起来很慢，而且额度跑的很快

--【捌】--：

没缓存的话,token消耗不得直接起飞呀

--【玖】--：

不清楚，可能不赚钱就不怎么管了吧。感觉火山也不是很重视这个业务，其他业务太赚钱了

--【拾】--：

真的还有mini2.7,现在炸了注册不了了，我想上去看看一直验证频繁

--【拾壹】--：

官方特意说了，pro和lite可用模型一样，速率也一样，唯一区别就是价格和给的限额不一样

--【拾贰】--：

不可能没有缓存吧，没缓存推理很慢的，而且计算成本很高。更有可能的是缓存按原价算（

--【拾叁】--：

感觉可能是草台班子直接把新模型怼上线了，都没来得及搞缓存。。。

没缓存的话，再多卡他也跑不动

--【拾肆】--：

不知道是水平不行，还是故意的。。。不加缓存对字节没好处啊，算力浪费了，结果还挨了骂

--【拾伍】--：

慢死了，一个接口20s都不响应，我们是公司开的企业版的

--【拾陆】--：

硅基流动也上k2.6了，我试了一下，现在暂时挺快的。。。估计暂时没什么人蹬。。。人多了就不好说了。。。

--【拾柒】--：

垃圾，上午用了下，tps只有2，还动不动就429，才10点不到，还没到真正的高峰期吧应该。

--【拾捌】--：

凌晨知道过后就开了个lite, 正准备在cc中好好体验一下glm5.1, 结果一个任务中的一个小task没做完5小时额度就爆了.

--【拾玖】--：

他家一直没缓存，春节的时候我就买他们家coding plan了，前几天还好，后面就慢慢不行了，压根用不了的状态。

标签：人工智能