火山的 Coding Plan 上了 GLM-5.1 和 K2.6,不过貌似还没有缓存,计费爆炸
- 内容介绍
- 文章标签
- 相关推荐
他家的coding plan和glm类似,是按照token计费的
但是刚才试了一下,好像是没有缓存的,所以计费爆炸,限额跑的飞快
不知道会不会修一下,没有缓存字节也血亏吧
网友解答:--【壹】--:
能正常用的话,性价比无敌了吧,国产三巨头新模型都上了
--【贰】--:
会不会是分的卡太少了,不加缓存反而比加缓存跑得快,毕竟缓存要显存的。
--【叁】--:
火山上的是量化版的5.1吗?之前有说不是满血的
--【肆】--:
这样嘛 ,那我是真觉得火山的coding plan有点拉了。我记得2月过年前后,火山的客服给我打电话还问我用起来有啥问题,它和我说lite会专门限制并发来着
--【伍】--:
火山的tps慢的想死,开了俩月lite给我折磨死了,不知道贵一档的tps能不能好点。也不知道是不是上的第三方模型背后都是量化过的,体感比其他地方的蠢一些
--【陆】--:
巨拉巨拉巨拉巨拉,我的评价是把钱扔了都不要去买他们家,扔了我至少不生气。但凡看见火山的帖子我都得进来骂两句,太气人了
--【柒】--:
如果有缓存的话,这个coding plan就很强了
现在没有缓存跑起来很慢,而且额度跑的很快
--【捌】--:
没缓存的话,token消耗不得直接起飞呀
--【玖】--:
不清楚,可能不赚钱就不怎么管了吧。感觉火山也不是很重视这个业务,其他业务太赚钱了
--【拾】--:
真的还有mini2.7,现在炸了注册不了了,我想上去看看一直验证频繁
--【拾壹】--:
官方特意说了,pro和lite可用模型一样,速率也一样,唯一区别就是价格和给的限额不一样
--【拾贰】--:
不可能没有缓存吧,没缓存推理很慢的,而且计算成本很高。更有可能的是缓存按原价算(
--【拾叁】--:
感觉可能是草台班子直接把新模型怼上线了,都没来得及搞缓存。。。
没缓存的话,再多卡他也跑不动
--【拾肆】--:
不知道是水平不行,还是故意的。。。不加缓存对字节没好处啊,算力浪费了,结果还挨了骂
--【拾伍】--:
慢死了,一个接口20s都不响应,我们是公司开的企业版的
--【拾陆】--:
硅基流动也上k2.6了,我试了一下,现在暂时挺快的。。。 估计暂时没什么人蹬。。。 人多了就不好说了。。。
--【拾柒】--:
垃圾,上午用了下,tps只有2,还动不动就429,才10点不到,还没到真正的高峰期吧应该。
--【拾捌】--:
凌晨知道过后就开了个lite, 正准备在cc中好好体验一下glm5.1, 结果一个任务中的一个小task没做完5小时额度就爆了.
--【拾玖】--:
他家一直没缓存,春节的时候我就买他们家coding plan了,前几天还好,后面就慢慢不行了,压根用不了的状态。
他家的coding plan和glm类似,是按照token计费的
但是刚才试了一下,好像是没有缓存的,所以计费爆炸,限额跑的飞快
不知道会不会修一下,没有缓存字节也血亏吧
网友解答:--【壹】--:
能正常用的话,性价比无敌了吧,国产三巨头新模型都上了
--【贰】--:
会不会是分的卡太少了,不加缓存反而比加缓存跑得快,毕竟缓存要显存的。
--【叁】--:
火山上的是量化版的5.1吗?之前有说不是满血的
--【肆】--:
这样嘛 ,那我是真觉得火山的coding plan有点拉了。我记得2月过年前后,火山的客服给我打电话还问我用起来有啥问题,它和我说lite会专门限制并发来着
--【伍】--:
火山的tps慢的想死,开了俩月lite给我折磨死了,不知道贵一档的tps能不能好点。也不知道是不是上的第三方模型背后都是量化过的,体感比其他地方的蠢一些
--【陆】--:
巨拉巨拉巨拉巨拉,我的评价是把钱扔了都不要去买他们家,扔了我至少不生气。但凡看见火山的帖子我都得进来骂两句,太气人了
--【柒】--:
如果有缓存的话,这个coding plan就很强了
现在没有缓存跑起来很慢,而且额度跑的很快
--【捌】--:
没缓存的话,token消耗不得直接起飞呀
--【玖】--:
不清楚,可能不赚钱就不怎么管了吧。感觉火山也不是很重视这个业务,其他业务太赚钱了
--【拾】--:
真的还有mini2.7,现在炸了注册不了了,我想上去看看一直验证频繁
--【拾壹】--:
官方特意说了,pro和lite可用模型一样,速率也一样,唯一区别就是价格和给的限额不一样
--【拾贰】--:
不可能没有缓存吧,没缓存推理很慢的,而且计算成本很高。更有可能的是缓存按原价算(
--【拾叁】--:
感觉可能是草台班子直接把新模型怼上线了,都没来得及搞缓存。。。
没缓存的话,再多卡他也跑不动
--【拾肆】--:
不知道是水平不行,还是故意的。。。不加缓存对字节没好处啊,算力浪费了,结果还挨了骂
--【拾伍】--:
慢死了,一个接口20s都不响应,我们是公司开的企业版的
--【拾陆】--:
硅基流动也上k2.6了,我试了一下,现在暂时挺快的。。。 估计暂时没什么人蹬。。。 人多了就不好说了。。。
--【拾柒】--:
垃圾,上午用了下,tps只有2,还动不动就429,才10点不到,还没到真正的高峰期吧应该。
--【拾捌】--:
凌晨知道过后就开了个lite, 正准备在cc中好好体验一下glm5.1, 结果一个任务中的一个小task没做完5小时额度就爆了.
--【拾玖】--:
他家一直没缓存,春节的时候我就买他们家coding plan了,前几天还好,后面就慢慢不行了,压根用不了的状态。

