请问下佬友们哪里有比如轻量模型,免费且不限制并发数。
- 内容介绍
- 文章标签
- 相关推荐
标题是有点痴心妄想了,但是还是想问问大佬们有没有推荐的路子或者渠道。
网友解答:--【壹】--:
那你找到了吗
--【贰】--:
但是他这个模型蠢到话都说不对
--【叁】--:
- 硅基的免费模型,并发应该还可以,不过卡顿明显
- 美团的 longcat 模型,我记得美团是有个小模型,每天的量也挺多,可以根据多搞几个号
- 整合公益站、免费模型或者自己买 token/codingplan,统一管理,重定向到一个模型名称,前提是你的服务器能撑住,回答质量也可能会参差不齐(同一套提示词控制模型输出的结果可能大不相同,建议不要太多不同的模型)
楼上提到 jimmy 的那个,话都说不完整,还经常答非所问的乱回复,根本没法用,比不过现在的0.5b 模型…
--【肆】--:
搞台苹果M5直接本地跑个qwen 35b
量大管饱
--【伍】--:
完全不限制的肯定没有,但硅基流动的小模型应该够了我记得是500并发
--【陆】--:
kiro有个免费的,注册就有api,有minimax2.5和小米v2pro等模型。论坛搜教程。
cursor ask2api,这个免费claude sonnet4.6,论坛搜有部署帖。
--【柒】--:
我也一直在找,当然主要是沉浸翻译用,这玩意除了个别几句话,完全不需要高质量模型,要的就是快和并发稍高
然而这需求也是没有
--【捌】--:
美团longcat,多注册几个号轮询下应该可以
--【玖】--:
有个比较小众的,qwen3-coder-flash,注册几十个号cpa轮询够用,速度挺快
--【拾】--:
感谢佬友们提供的意见 @zhubaiwan-oozzxx @JIUUIJ @jlz7230220 @koubibulaien @jlz7230220 @BlitzKat @jlz7230220
--【拾壹】--:
这个有多聪明啊
--【拾贰】--:
35b肯定不聪明了, SFT下做点问答还行, 多轮一下就跪了
--【拾叁】--:
肯定是窜稀大王Jimmy呀
Jimmy:别管对不对,你就说快不快,并发高不高就对了
标题是有点痴心妄想了,但是还是想问问大佬们有没有推荐的路子或者渠道。
网友解答:--【壹】--:
那你找到了吗
--【贰】--:
但是他这个模型蠢到话都说不对
--【叁】--:
- 硅基的免费模型,并发应该还可以,不过卡顿明显
- 美团的 longcat 模型,我记得美团是有个小模型,每天的量也挺多,可以根据多搞几个号
- 整合公益站、免费模型或者自己买 token/codingplan,统一管理,重定向到一个模型名称,前提是你的服务器能撑住,回答质量也可能会参差不齐(同一套提示词控制模型输出的结果可能大不相同,建议不要太多不同的模型)
楼上提到 jimmy 的那个,话都说不完整,还经常答非所问的乱回复,根本没法用,比不过现在的0.5b 模型…
--【肆】--:
搞台苹果M5直接本地跑个qwen 35b
量大管饱
--【伍】--:
完全不限制的肯定没有,但硅基流动的小模型应该够了我记得是500并发
--【陆】--:
kiro有个免费的,注册就有api,有minimax2.5和小米v2pro等模型。论坛搜教程。
cursor ask2api,这个免费claude sonnet4.6,论坛搜有部署帖。
--【柒】--:
我也一直在找,当然主要是沉浸翻译用,这玩意除了个别几句话,完全不需要高质量模型,要的就是快和并发稍高
然而这需求也是没有
--【捌】--:
美团longcat,多注册几个号轮询下应该可以
--【玖】--:
有个比较小众的,qwen3-coder-flash,注册几十个号cpa轮询够用,速度挺快
--【拾】--:
感谢佬友们提供的意见 @zhubaiwan-oozzxx @JIUUIJ @jlz7230220 @koubibulaien @jlz7230220 @BlitzKat @jlz7230220
--【拾壹】--:
这个有多聪明啊
--【拾贰】--:
35b肯定不聪明了, SFT下做点问答还行, 多轮一下就跪了
--【拾叁】--:
肯定是窜稀大王Jimmy呀
Jimmy:别管对不对,你就说快不快,并发高不高就对了

