有佬友知道小模型的便宜渠道吗
- 内容介绍
- 文章标签
- 相关推荐
做的AI客服类产品,对模型智商没啥要求,基本上有个30B左右就够用了,大家知道什么比较便宜的渠道吗?因为看各个平台的小模型 比如qwen系列的,几十B的版本和满血版价格都差不太多
我能想到的就是逆向一些API,这个应该有很多地方可以薅,但是实在太麻烦,而且稳定性也不理想
--【壹】--:
百炼吧,模型跨度比较大,turbo,flash,plus,max
--【贰】--:
小参数不如自建
--【叁】--:
30B的话不如买个mac mini自建部署
--【肆】--:
生产上用,建议你还是付费使用,而且你用量还大,逆向API都撑不了几天
--【伍】--:
我们用量比较大呀 自己部署成本还是划不来
--【陆】--:
看你们并发量,40以内自部署就行了,超过了 还是老实买api吧
--【柒】--:
智谱 GLM-4.7-Flash 30B的免费,佬可以看看能不能满足
GLM-4.7-Flash - 智谱AI开放文档
--【捌】--:
自己搞几台mac mini 建吧
--【玖】--:
用量越大,自己部署越划得来,不过,生产环境 Mac Mini 还是不够,买张显卡吧
--【拾】--:
百炼的价格会低一些,128k 应该也是够你用的
1774841944989_d1127×257 13.8 KB
--【拾壹】--:
主要是感觉这些小模型定价有点贵 比如siliconflow上 35B的版本价格才是397B版本的差不多一半 感觉应该有更便宜的渠道
--【拾贰】--:
我之前给一个中转站拉了很多新用户,然后那个中转站不给用最新模型了(新模型得去新站,重新充值 )
只给用gpt-5-chat,还有mini、nano之类的垃圾模型。。。我都不用了,还有几百刀余额就当废了
--【拾叁】--:
并发限制1 hhh
做的AI客服类产品,对模型智商没啥要求,基本上有个30B左右就够用了,大家知道什么比较便宜的渠道吗?因为看各个平台的小模型 比如qwen系列的,几十B的版本和满血版价格都差不太多
我能想到的就是逆向一些API,这个应该有很多地方可以薅,但是实在太麻烦,而且稳定性也不理想
--【壹】--:
百炼吧,模型跨度比较大,turbo,flash,plus,max
--【贰】--:
小参数不如自建
--【叁】--:
30B的话不如买个mac mini自建部署
--【肆】--:
生产上用,建议你还是付费使用,而且你用量还大,逆向API都撑不了几天
--【伍】--:
我们用量比较大呀 自己部署成本还是划不来
--【陆】--:
看你们并发量,40以内自部署就行了,超过了 还是老实买api吧
--【柒】--:
智谱 GLM-4.7-Flash 30B的免费,佬可以看看能不能满足
GLM-4.7-Flash - 智谱AI开放文档
--【捌】--:
自己搞几台mac mini 建吧
--【玖】--:
用量越大,自己部署越划得来,不过,生产环境 Mac Mini 还是不够,买张显卡吧
--【拾】--:
百炼的价格会低一些,128k 应该也是够你用的
1774841944989_d1127×257 13.8 KB
--【拾壹】--:
主要是感觉这些小模型定价有点贵 比如siliconflow上 35B的版本价格才是397B版本的差不多一半 感觉应该有更便宜的渠道
--【拾贰】--:
我之前给一个中转站拉了很多新用户,然后那个中转站不给用最新模型了(新模型得去新站,重新充值 )
只给用gpt-5-chat,还有mini、nano之类的垃圾模型。。。我都不用了,还有几百刀余额就当废了
--【拾叁】--:
并发限制1 hhh

