Qwen 3.6 Plus评测:进步卓著,不过一般
- 内容介绍
- 文章标签
- 相关推荐
image952×425 8.5 KB
Qwen 3.6 Plus目前已在OpenRouter免费调用 现在厂商都学会免费刷榜了是吧
Qwen3.6 Plus Preview (free) - API Pricing & Providers
Qwen 3.6 Plus Preview is the next-generation evolution of the Qwen Plus series, featuring an advanced hybrid architecture that improves efficiency and scalability. $0 per million input tokens, $0 per million output tokens. 1,000,000 token context...
放一些有趣的结果
image1229×794 163 KB
image1181×796 130 KB
这个模型有一些Gemini味,不同的是一写代码就奔着几千行去了。但与此同时,幻觉率似乎有点高
看来从谷歌挖训练3p的人确实有用啊
林俊旸你还在看吗
这个模型的tps非常快,估计还是三四百B的小模型
网友解答:--【壹】--:
昨天还发布了一个 Qwen3.5 Omni 版本。
--【贰】--:
大佬大佬大佬 能不能分享下提示词 那就是我的问题
--【叁】--:
你是怎么测的,用归一化的坐标吗
--【肆】--:
不知道百炼上了没有
--【伍】--:
但是在做一些识图题上面(你懂的,类似点击只出现1个颜色的那种题目),思考能力相比第一梯队的GPT Claude还是差了点,不过嘛 胜在便宜
--【陆】--:
我纯粹就是爱好者,喜欢测试这个
--【柒】--:
看起来不错,准备使用。
我还以为佬你不会测它呢hhh
--【捌】--:
感谢大佬测试,qwen啥时候能赶上智谱啊。。
--【玖】--:
image289×212 49.3 KB
类似这样的 或者根据左边图片找右边相似的识图验证码,这种不需要多强大的识图能力,主要是逻辑推理
--【拾】--:
国产新模型出来文案模板:性能提升,再创辉煌,仍有进步空间
--【拾壹】--:
我靠 3.6?这么快
--【拾贰】--:
感觉qwen3有了gemini3的坏毛病 不肯输出 能省就省
--【拾叁】--:
tps这么快
--【拾肆】--:
我去感受一下去
--【拾伍】--:
迭代速度还越来越快了
--【拾陆】--:
你想太多了,你不会是QWEN的开发人员吧,咱们应用层测试就突出TM一个简单粗暴:
截图喂给模型 模拟点击 能过就是能过 不能过就不能过 人工看 点的位置能明显看出来有问题 或者模型直接说没有答案
这种还没有像hcaptcha的干扰层,就是纯推理 模拟点击
给大佬滑跪
--【拾柒】--:
PixPin_2026-03-31_10-00-33947×895 104 KB
我自己的测试平台
--【拾捌】--:
什么识图题
我记得claude的识图能力是二流水平
--【拾玖】--:
不能nsfw,没意思
image952×425 8.5 KB
Qwen 3.6 Plus目前已在OpenRouter免费调用 现在厂商都学会免费刷榜了是吧
Qwen3.6 Plus Preview (free) - API Pricing & Providers
Qwen 3.6 Plus Preview is the next-generation evolution of the Qwen Plus series, featuring an advanced hybrid architecture that improves efficiency and scalability. $0 per million input tokens, $0 per million output tokens. 1,000,000 token context...
放一些有趣的结果
image1229×794 163 KB
image1181×796 130 KB
这个模型有一些Gemini味,不同的是一写代码就奔着几千行去了。但与此同时,幻觉率似乎有点高
看来从谷歌挖训练3p的人确实有用啊
林俊旸你还在看吗
这个模型的tps非常快,估计还是三四百B的小模型
网友解答:--【壹】--:
昨天还发布了一个 Qwen3.5 Omni 版本。
--【贰】--:
大佬大佬大佬 能不能分享下提示词 那就是我的问题
--【叁】--:
你是怎么测的,用归一化的坐标吗
--【肆】--:
不知道百炼上了没有
--【伍】--:
但是在做一些识图题上面(你懂的,类似点击只出现1个颜色的那种题目),思考能力相比第一梯队的GPT Claude还是差了点,不过嘛 胜在便宜
--【陆】--:
我纯粹就是爱好者,喜欢测试这个
--【柒】--:
看起来不错,准备使用。
我还以为佬你不会测它呢hhh
--【捌】--:
感谢大佬测试,qwen啥时候能赶上智谱啊。。
--【玖】--:
image289×212 49.3 KB
类似这样的 或者根据左边图片找右边相似的识图验证码,这种不需要多强大的识图能力,主要是逻辑推理
--【拾】--:
国产新模型出来文案模板:性能提升,再创辉煌,仍有进步空间
--【拾壹】--:
我靠 3.6?这么快
--【拾贰】--:
感觉qwen3有了gemini3的坏毛病 不肯输出 能省就省
--【拾叁】--:
tps这么快
--【拾肆】--:
我去感受一下去
--【拾伍】--:
迭代速度还越来越快了
--【拾陆】--:
你想太多了,你不会是QWEN的开发人员吧,咱们应用层测试就突出TM一个简单粗暴:
截图喂给模型 模拟点击 能过就是能过 不能过就不能过 人工看 点的位置能明显看出来有问题 或者模型直接说没有答案
这种还没有像hcaptcha的干扰层,就是纯推理 模拟点击
给大佬滑跪
--【拾柒】--:
PixPin_2026-03-31_10-00-33947×895 104 KB
我自己的测试平台
--【拾捌】--:
什么识图题
我记得claude的识图能力是二流水平
--【拾玖】--:
不能nsfw,没意思

