火山的 Coding Plan 上了 GLM-5.1 和 K2.6,不过貌似还没有缓存,计费爆炸

2026-04-29 09:303阅读0评论SEO问题
  • 内容介绍
  • 文章标签
  • 相关推荐
问题描述:

他家的coding plan和glm类似,是按照token计费的

但是刚才试了一下,好像是没有缓存的,所以计费爆炸,限额跑的飞快

不知道会不会修一下,没有缓存字节也血亏吧

网友解答:
--【壹】--:

能正常用的话,性价比无敌了吧,国产三巨头新模型都上了


--【贰】--:

会不会是分的卡太少了,不加缓存反而比加缓存跑得快,毕竟缓存要显存的。


--【叁】--:

火山上的是量化版的5.1吗?之前有说不是满血的


--【肆】--:

这样嘛 ,那我是真觉得火山的coding plan有点拉了。我记得2月过年前后,火山的客服给我打电话还问我用起来有啥问题,它和我说lite会专门限制并发来着


--【伍】--:

火山的tps慢的想死,开了俩月lite给我折磨死了,不知道贵一档的tps能不能好点。也不知道是不是上的第三方模型背后都是量化过的,体感比其他地方的蠢一些


--【陆】--:

巨拉巨拉巨拉巨拉,我的评价是把钱扔了都不要去买他们家,扔了我至少不生气。但凡看见火山的帖子我都得进来骂两句,太气人了


--【柒】--:

如果有缓存的话,这个coding plan就很强了

现在没有缓存跑起来很慢,而且额度跑的很快


--【捌】--:

没缓存的话,token消耗不得直接起飞呀


--【玖】--:

不清楚,可能不赚钱就不怎么管了吧。感觉火山也不是很重视这个业务,其他业务太赚钱了


--【拾】--:

真的还有mini2.7,现在炸了注册不了了,我想上去看看一直验证频繁


--【拾壹】--:

官方特意说了,pro和lite可用模型一样,速率也一样,唯一区别就是价格和给的限额不一样


--【拾贰】--:

不可能没有缓存吧,没缓存推理很慢的,而且计算成本很高。更有可能的是缓存按原价算(


--【拾叁】--:

感觉可能是草台班子直接把新模型怼上线了,都没来得及搞缓存。。。

没缓存的话,再多卡他也跑不动


--【拾肆】--:

不知道是水平不行,还是故意的。。。不加缓存对字节没好处啊,算力浪费了,结果还挨了骂


--【拾伍】--:

慢死了,一个接口20s都不响应,我们是公司开的企业版的


--【拾陆】--:

硅基流动也上k2.6了,我试了一下,现在暂时挺快的。。。 估计暂时没什么人蹬。。。 人多了就不好说了。。。


--【拾柒】--:

垃圾,上午用了下,tps只有2,还动不动就429,才10点不到,还没到真正的高峰期吧应该。


--【拾捌】--:

凌晨知道过后就开了个lite, 正准备在cc中好好体验一下glm5.1, 结果一个任务中的一个小task没做完5小时额度就爆了.


--【拾玖】--:

他家一直没缓存,春节的时候我就买他们家coding plan了,前几天还好,后面就慢慢不行了,压根用不了的状态。

标签:人工智能
问题描述:

他家的coding plan和glm类似,是按照token计费的

但是刚才试了一下,好像是没有缓存的,所以计费爆炸,限额跑的飞快

不知道会不会修一下,没有缓存字节也血亏吧

网友解答:
--【壹】--:

能正常用的话,性价比无敌了吧,国产三巨头新模型都上了


--【贰】--:

会不会是分的卡太少了,不加缓存反而比加缓存跑得快,毕竟缓存要显存的。


--【叁】--:

火山上的是量化版的5.1吗?之前有说不是满血的


--【肆】--:

这样嘛 ,那我是真觉得火山的coding plan有点拉了。我记得2月过年前后,火山的客服给我打电话还问我用起来有啥问题,它和我说lite会专门限制并发来着


--【伍】--:

火山的tps慢的想死,开了俩月lite给我折磨死了,不知道贵一档的tps能不能好点。也不知道是不是上的第三方模型背后都是量化过的,体感比其他地方的蠢一些


--【陆】--:

巨拉巨拉巨拉巨拉,我的评价是把钱扔了都不要去买他们家,扔了我至少不生气。但凡看见火山的帖子我都得进来骂两句,太气人了


--【柒】--:

如果有缓存的话,这个coding plan就很强了

现在没有缓存跑起来很慢,而且额度跑的很快


--【捌】--:

没缓存的话,token消耗不得直接起飞呀


--【玖】--:

不清楚,可能不赚钱就不怎么管了吧。感觉火山也不是很重视这个业务,其他业务太赚钱了


--【拾】--:

真的还有mini2.7,现在炸了注册不了了,我想上去看看一直验证频繁


--【拾壹】--:

官方特意说了,pro和lite可用模型一样,速率也一样,唯一区别就是价格和给的限额不一样


--【拾贰】--:

不可能没有缓存吧,没缓存推理很慢的,而且计算成本很高。更有可能的是缓存按原价算(


--【拾叁】--:

感觉可能是草台班子直接把新模型怼上线了,都没来得及搞缓存。。。

没缓存的话,再多卡他也跑不动


--【拾肆】--:

不知道是水平不行,还是故意的。。。不加缓存对字节没好处啊,算力浪费了,结果还挨了骂


--【拾伍】--:

慢死了,一个接口20s都不响应,我们是公司开的企业版的


--【拾陆】--:

硅基流动也上k2.6了,我试了一下,现在暂时挺快的。。。 估计暂时没什么人蹬。。。 人多了就不好说了。。。


--【拾柒】--:

垃圾,上午用了下,tps只有2,还动不动就429,才10点不到,还没到真正的高峰期吧应该。


--【拾捌】--:

凌晨知道过后就开了个lite, 正准备在cc中好好体验一下glm5.1, 结果一个任务中的一个小task没做完5小时额度就爆了.


--【拾玖】--:

他家一直没缓存,春节的时候我就买他们家coding plan了,前几天还好,后面就慢慢不行了,压根用不了的状态。

标签:人工智能