知乎测评:qwen3.6 plus编程能力超过GLM5,接近Sonnet4.5,前端能力突出
- 内容介绍
- 文章标签
- 相关推荐
image1300×490 91.9 KB
Qwen3.6-Plus重返编程模型第一梯队,测试结果显示编程能力超过GLM5,直追Sonnet4.5,接近生产水平。
国产编程新势力来了?
Qwen3.6-Plus 编程能力测试 - toyama nao的文章 - 知乎
https://zhuanlan.zhihu.com/p/2023709967123784106
补充:nao的榜单风评不错,比较接近体感,目前使用的code v3榜单是在三个生产级项目上测试,完整榜单见LLM Benchmark Dashboard
2026.4.2,qwen3.6plus已上线qwen code,每日免费1000调用
网友解答:GitHub - QwenLM/qwen-code: An open-source AI agent that lives in your terminal. · GitHub
--【壹】--:
opus的测试怎么还跳过?
--【贰】--:
主要是Sonnet4.5已经是2025年9月30日推出的模型了。大约来看国模和外模差不多半年这样。
--【叁】--:
因为GLM5.1没有正式推出,现在只有CodingPlan能用。知乎上的这个人也测了GLM5.1。
--【肆】--:
很奇怪,至今没有看到 glm-5.1 的测评。arena 上 qwen 3.6 也超越了 glm-5
--【伍】--:
国产每次出新模型都超4.5
--【陆】--:
保持质疑
--【柒】--:
这个去年我用过。。。(当时是qwen3 coder)
感觉和魔搭白嫖的智商差很多。。。经常鬼打墙。。。 不知道这里提供的是不是量化的。。。
--【捌】--:
佬好!qwen是不是有个qwen code cli,每天免费两千次?调用的是qwen3.6-plus么?
--【玖】--:
glm5不是已经赶上Sonnet4.5了吗,现在又接近了
--【拾】--:
是的,昨天上线,佬友可以用起来
image1715×315 35.4 KB
--【拾壹】--:
这个说话还比较稳重,没说赶超opus
--【拾贰】--:
魔搭当时宣称每天2000次,后面好像降额严重,我就一直用cli自己提供的auth了,我再去看看魔搭现在啥情况
--【拾叁】--:
image934×478 10.5 KB
让我先试试,正好codex最近用不了了,上周用的时候感觉只能处理一些基础任务,不会像codex那样去追索代码的前后文,不去追寻问题根源,代码修改逻辑非常混乱没有规划,这次我再试试看。(是不是因为我没有安装skills或者没有用prompt?)
好处在于,低强度调用每天免费。
--【拾肆】--:
现在是每天 1000 次请求了,并且隐私声明里边,有明说会将数据用于训练。
--【拾伍】--:
谢谢佬!这就去用
--【拾陆】--:
刚看到别的佬的帖子
第一次这么痛恨回复超级快的模型。说的就是你啊。qwen 3.6 plus 搞七捻三mimo 2 pro 不免费了(是的甚至还被反薅了5刀。 然后我的龙虾换成了5.4,吐得太慢,有点受不了。今晚改东西就想着要不试试 qwen 3.6 plus 一开始速度可太快了,非常爽,甚至让他改gpt拒绝处理的一些任务比如解决注册问题,他都表示给我10秒钟搞定。 但是随着时间越久,问题出来了。一些需要实实在在解决问题的,属于是嘴上说得好听实际执行一塌糊涂。遇到问题了,来一句,老板,这肯定…
--【拾柒】--:
谢谢佬提醒!那我不敢拿他给个人信息和关键数据之类的写代码了
--【拾捌】--:
之前是3.5,这次3.6的提升很大的
--【拾玖】--:
不一样的,其他榜单刷分很严重,nao的榜单风评还是比较好的,接近体感。
另外,评测永远有局限性,实际工程应用还是会不同
image1300×490 91.9 KB
Qwen3.6-Plus重返编程模型第一梯队,测试结果显示编程能力超过GLM5,直追Sonnet4.5,接近生产水平。
国产编程新势力来了?
Qwen3.6-Plus 编程能力测试 - toyama nao的文章 - 知乎
https://zhuanlan.zhihu.com/p/2023709967123784106
补充:nao的榜单风评不错,比较接近体感,目前使用的code v3榜单是在三个生产级项目上测试,完整榜单见LLM Benchmark Dashboard
2026.4.2,qwen3.6plus已上线qwen code,每日免费1000调用
网友解答:GitHub - QwenLM/qwen-code: An open-source AI agent that lives in your terminal. · GitHub
--【壹】--:
opus的测试怎么还跳过?
--【贰】--:
主要是Sonnet4.5已经是2025年9月30日推出的模型了。大约来看国模和外模差不多半年这样。
--【叁】--:
因为GLM5.1没有正式推出,现在只有CodingPlan能用。知乎上的这个人也测了GLM5.1。
--【肆】--:
很奇怪,至今没有看到 glm-5.1 的测评。arena 上 qwen 3.6 也超越了 glm-5
--【伍】--:
国产每次出新模型都超4.5
--【陆】--:
保持质疑
--【柒】--:
这个去年我用过。。。(当时是qwen3 coder)
感觉和魔搭白嫖的智商差很多。。。经常鬼打墙。。。 不知道这里提供的是不是量化的。。。
--【捌】--:
佬好!qwen是不是有个qwen code cli,每天免费两千次?调用的是qwen3.6-plus么?
--【玖】--:
glm5不是已经赶上Sonnet4.5了吗,现在又接近了
--【拾】--:
是的,昨天上线,佬友可以用起来
image1715×315 35.4 KB
--【拾壹】--:
这个说话还比较稳重,没说赶超opus
--【拾贰】--:
魔搭当时宣称每天2000次,后面好像降额严重,我就一直用cli自己提供的auth了,我再去看看魔搭现在啥情况
--【拾叁】--:
image934×478 10.5 KB
让我先试试,正好codex最近用不了了,上周用的时候感觉只能处理一些基础任务,不会像codex那样去追索代码的前后文,不去追寻问题根源,代码修改逻辑非常混乱没有规划,这次我再试试看。(是不是因为我没有安装skills或者没有用prompt?)
好处在于,低强度调用每天免费。
--【拾肆】--:
现在是每天 1000 次请求了,并且隐私声明里边,有明说会将数据用于训练。
--【拾伍】--:
谢谢佬!这就去用
--【拾陆】--:
刚看到别的佬的帖子
第一次这么痛恨回复超级快的模型。说的就是你啊。qwen 3.6 plus 搞七捻三mimo 2 pro 不免费了(是的甚至还被反薅了5刀。 然后我的龙虾换成了5.4,吐得太慢,有点受不了。今晚改东西就想着要不试试 qwen 3.6 plus 一开始速度可太快了,非常爽,甚至让他改gpt拒绝处理的一些任务比如解决注册问题,他都表示给我10秒钟搞定。 但是随着时间越久,问题出来了。一些需要实实在在解决问题的,属于是嘴上说得好听实际执行一塌糊涂。遇到问题了,来一句,老板,这肯定…
--【拾柒】--:
谢谢佬提醒!那我不敢拿他给个人信息和关键数据之类的写代码了
--【拾捌】--:
之前是3.5,这次3.6的提升很大的
--【拾玖】--:
不一样的,其他榜单刷分很严重,nao的榜单风评还是比较好的,接近体感。
另外,评测永远有局限性,实际工程应用还是会不同

