GLM-5.1 Kimi-K2.6 Claude Opus4.7横评对比

2026-04-29 09:442阅读0评论SEO问题

内容介绍
文章标签
相关推荐

问题描述：

一、环境及提示词

订阅情况：

GLM-5.1 : 智谱国内站新Max套餐(460元)。
Kimi-k2.6: kimi 199元档位套餐。
Claude Opus-4.7: Max满血中转(经测试未降智且支持1M上下文)。

本次测试中CC均设置为200K上下文窗口。毕竟这个小项目用不到1M。

提示词统一为:

为我规划一个2048网页小游戏，需要实现排行榜功能，按照用户脱敏IP进行排行，每个IP保留最高记录。
使用next.js + shadcn + tailwindcss + sqlite3 来实现。使用APP Router来实现后端接口。

CLI工具：
统一使用Claude Code v2.1.111

二、CC Cli结果对比

GLM-5.1最后的报错是因为我手动kill了npm run dev进程，来进行下一轮测试。

图片1920×1206 391 KB

对比结果

指标	GLM-5.1	Kimi-k2.6	Claude Opus-4.7
耗费时间	19m58s	14m22s	3m21s
完成时上下文窗口	33%	16%	19%
备注	调用子 agent 并行文件写入	-–	-–

三、前端页面横向对比

从左至右，分别为GLM-5.1 、 Kimi-K2.6 、 Claude Opus 4.7
npm run dev启动，三个报错均为SSR问题。

图片1920×910 129 KB

四、项目架构对比

GLM-5.1 CC工作目录为 ~/Desktop/2048testglm/，目录架构如下：

➜ 2048testglm git:(main) ✗ tree -I 'node_modules|.git|.next' -L 4 . ├── AGENTS.md ├── app │ ├── api │ │ └── leaderboard │ │ └── route.ts │ ├── favicon.ico │ ├── globals.css │ ├── layout.tsx │ └── page.tsx ├── CLAUDE.md ├── components │ ├── game │ │ ├── game-board.tsx │ │ ├── game-container.tsx │ │ ├── game-header.tsx │ │ ├── game-over-overlay.tsx │ │ └── game-tile.tsx │ ├── leaderboard │ │ └── leaderboard-table.tsx │ └── ui │ ├── button.tsx │ ├── card.tsx │ └── table.tsx ├── components.json ├── data │ ├── game.db │ ├── game.db-shm │ └── game.db-wal ├── eslint.config.mjs ├── hooks │ ├── use-game.ts │ ├── use-keyboard.ts │ └── use-touch.ts ├── lib │ ├── db.ts │ ├── game │ │ ├── core.ts │ │ └── types.ts │ ├── ip.ts │ ├── schema.sql │ └── utils.ts ├── next-env.d.ts ├── next.config.ts ├── package-lock.json ├── package.json ├── postcss.config.mjs ├── public │ ├── file.svg │ ├── globe.svg │ ├── next.svg │ ├── vercel.svg │ └── window.svg ├── README.md └── tsconfig.json 13 directories, 42 files

Kimi-K2.6 CC工作目录为 ~/Desktop/2048testkimi/，目录架构如下：

➜ 2048testkimi tree -I 'node_modules|.git|.next' -L 4 . └── my-app ├── AGENTS.md ├── CLAUDE.md ├── components.json ├── data │ ├── scores.db │ ├── scores.db-shm │ └── scores.db-wal ├── eslint.config.mjs ├── next-env.d.ts ├── next.config.ts ├── package-lock.json ├── package.json ├── postcss.config.mjs ├── public │ ├── file.svg │ ├── globe.svg │ ├── next.svg │ ├── vercel.svg │ └── window.svg ├── README.md ├── src │ ├── app │ │ ├── api │ │ ├── favicon.ico │ │ ├── globals.css │ │ ├── layout.tsx │ │ └── page.tsx │ ├── components │ │ ├── game-board.tsx │ │ ├── leaderboard.tsx │ │ └── ui │ └── lib │ ├── db.ts │ ├── game-logic.ts │ └── utils.ts └── tsconfig.json 10 directories, 28 files

Claude Opus 4.7 CC工作目录为 ~/Desktop/2048testopus/，目录架构如下：

➜ 2048testopus git:(main) ✗ tree -I 'node_modules|.git|.next' -L 4 . ├── AGENTS.md ├── app │ ├── api │ │ └── scores │ │ └── route.ts │ ├── favicon.ico │ ├── globals.css │ ├── layout.tsx │ └── page.tsx ├── CLAUDE.md ├── components │ ├── game-board.tsx │ ├── leaderboard.tsx │ ├── tile.tsx │ └── ui │ ├── button.tsx │ ├── card.tsx │ ├── dialog.tsx │ └── table.tsx ├── components.json ├── data │ ├── scores.db │ ├── scores.db-shm │ └── scores.db-wal ├── eslint.config.mjs ├── lib │ ├── db.ts │ ├── game-logic.ts │ └── utils.ts ├── next-env.d.ts ├── next.config.ts ├── package-lock.json ├── package.json ├── postcss.config.mjs ├── public │ ├── file.svg │ ├── globe.svg │ ├── next.svg │ ├── vercel.svg │ └── window.svg ├── README.md └── tsconfig.json 9 directories, 34 files

五、结论

小游戏大差不差。

本次测试中也只有Kimi-k2.6在2048testkimi 目录下使用shadcn初始化项目到了`2048testkimi/my-app`目录，其余模型正常。
今天刚买Kimi订阅时，第一轮对kimi-k2.6测试时出现了异常，一轮对话未正常完成项目规划和代码编写。但这轮并行测试时反倒输出的跟Opus 4.7很类似。
第一轮k2.6写的前端页面如下图，且后端报错未安装better-sqlite3。

图片1382×1326 55.6 KB

网友解答：

--【壹】--：

认真的吗?海外版的ZAI是18…美刀诶
虽然确实是18就是了

--【贰】--：

实话说，kimi k2.6连2048小游戏的实现都能出错，再去测试的意义不大了。等下一轮迭代吧。

GLM-5.1的效果还不错的，上周高强度用了一周。在CC上用，多轮压缩后结合memory，会话主线丢失不太多。最多单会话多轮跑过连续12小时的。

如果你能忍受智谱的token速度，那可以考虑使用GLM-5.1了。

况且GLM估计马上又要出新模型了。

图片2414×1136 231 KB

--【叁】--：

是的，不过即使是这种已经玩烂的场景，kimi k2.6的效果依然不稳定。

--【肆】--：

GPT的黑话是真的多，不过我一般让他做完后生成简报

不然是真看不懂

--【伍】--：

总结：
结果差不多，能干活，但是爱走弯路。

--【陆】--：

不要测试这种大众化的2048，这类小游戏太多人做过，这些大模型训练集里一大堆，让他们做等于让他们背出来。
至少要测一些不常见的需求（我暂时也没想出来）

--【柒】--：

GLM5.1有海外版18一个月，可以看看

--【捌】--：

从耗费时间来看，Claude Opus实在是太强了

--【玖】--：

每个月不要超过20是我的承受极限。
请不要这么贵好，不好？

--【拾】--： TOT:

测试未降智

佬，怎么测试是不是满血的中转站，有链接嘛？

--【拾壹】--：

偏向Opus，但思考的不多，容易漏细节。这方面不如GLM-5.1

--【拾贰】--：

kimi 没黑话吧 gpt的输出是真的难读

--【拾叁】--：

小功能测不出来，佬，整点复杂度高一点的需求试试呢。glm5.1我还没用过，但是5我感觉和gpt差距都很明显啊

--【拾肆】--：

GLM就是思考时间太长了，其他性价比来说没的说
opus太贵

--【拾伍】--：

大佬，Kimi遵循指令强吗，性格偏向于GPT还是Opus

--【拾陆】--：

唉，GLM-5.1如果有Kimi k2.6的token速度，何至于再去买个k2.6用。

智谱的算力不够，太慢了，8小时工作时间，输不了几次提示词就下班了

--【拾柒】--：

glm确实慢，下午让他帮忙翻译，每一段中间要卡个10分钟。
最后用kimi 2.6 agent集群半小时就搞定了。但是kimi要技能冷却4小时，贤者时间太长。

--【拾捌】--：

GLM-5.1不适合养虾，太慢了。
拿来工作很不错的，模型也够用，而且还慢。
输完提示词可以去蹲个坑再换杯茶，
工作节奏不紧不慢的，脑袋能得到放松。

--【拾玖】--： TOT:

五、结论

佬，有时间可以多来点这种对比测试啊，非常有用

标签：人工智能

问题描述：

一、环境及提示词

订阅情况：

GLM-5.1 : 智谱国内站新Max套餐(460元)。
Kimi-k2.6: kimi 199元档位套餐。
Claude Opus-4.7: Max满血中转(经测试未降智且支持1M上下文)。

本次测试中CC均设置为200K上下文窗口。毕竟这个小项目用不到1M。

提示词统一为:

为我规划一个2048网页小游戏，需要实现排行榜功能，按照用户脱敏IP进行排行，每个IP保留最高记录。
使用next.js + shadcn + tailwindcss + sqlite3 来实现。使用APP Router来实现后端接口。

CLI工具：
统一使用Claude Code v2.1.111

二、CC Cli结果对比

GLM-5.1最后的报错是因为我手动kill了npm run dev进程，来进行下一轮测试。

图片1920×1206 391 KB

对比结果

指标	GLM-5.1	Kimi-k2.6	Claude Opus-4.7
耗费时间	19m58s	14m22s	3m21s
完成时上下文窗口	33%	16%	19%
备注	调用子 agent 并行文件写入	-–	-–

三、前端页面横向对比

从左至右，分别为GLM-5.1 、 Kimi-K2.6 、 Claude Opus 4.7
npm run dev启动，三个报错均为SSR问题。

图片1920×910 129 KB

四、项目架构对比

GLM-5.1 CC工作目录为 ~/Desktop/2048testglm/，目录架构如下：

Kimi-K2.6 CC工作目录为 ~/Desktop/2048testkimi/，目录架构如下：

Claude Opus 4.7 CC工作目录为 ~/Desktop/2048testopus/，目录架构如下：

五、结论

小游戏大差不差。

本次测试中也只有Kimi-k2.6在2048testkimi 目录下使用shadcn初始化项目到了`2048testkimi/my-app`目录，其余模型正常。
今天刚买Kimi订阅时，第一轮对kimi-k2.6测试时出现了异常，一轮对话未正常完成项目规划和代码编写。但这轮并行测试时反倒输出的跟Opus 4.7很类似。
第一轮k2.6写的前端页面如下图，且后端报错未安装better-sqlite3。

图片1382×1326 55.6 KB

网友解答：

--【壹】--：

认真的吗?海外版的ZAI是18…美刀诶
虽然确实是18就是了

--【贰】--：

实话说，kimi k2.6连2048小游戏的实现都能出错，再去测试的意义不大了。等下一轮迭代吧。

GLM-5.1的效果还不错的，上周高强度用了一周。在CC上用，多轮压缩后结合memory，会话主线丢失不太多。最多单会话多轮跑过连续12小时的。

如果你能忍受智谱的token速度，那可以考虑使用GLM-5.1了。

况且GLM估计马上又要出新模型了。

图片2414×1136 231 KB

--【叁】--：

是的，不过即使是这种已经玩烂的场景，kimi k2.6的效果依然不稳定。

--【肆】--：

GPT的黑话是真的多，不过我一般让他做完后生成简报

不然是真看不懂

--【伍】--：

总结：
结果差不多，能干活，但是爱走弯路。

--【陆】--：

--【柒】--：

GLM5.1有海外版18一个月，可以看看

--【捌】--：

从耗费时间来看，Claude Opus实在是太强了

--【玖】--：

每个月不要超过20是我的承受极限。
请不要这么贵好，不好？

--【拾】--： TOT:

测试未降智

佬，怎么测试是不是满血的中转站，有链接嘛？

--【拾壹】--：

偏向Opus，但思考的不多，容易漏细节。这方面不如GLM-5.1

--【拾贰】--：

kimi 没黑话吧 gpt的输出是真的难读

--【拾叁】--：

小功能测不出来，佬，整点复杂度高一点的需求试试呢。glm5.1我还没用过，但是5我感觉和gpt差距都很明显啊

--【拾肆】--：

GLM就是思考时间太长了，其他性价比来说没的说
opus太贵

--【拾伍】--：

大佬，Kimi遵循指令强吗，性格偏向于GPT还是Opus

--【拾陆】--：

唉，GLM-5.1如果有Kimi k2.6的token速度，何至于再去买个k2.6用。

智谱的算力不够，太慢了，8小时工作时间，输不了几次提示词就下班了

--【拾柒】--：

glm确实慢，下午让他帮忙翻译，每一段中间要卡个10分钟。
最后用kimi 2.6 agent集群半小时就搞定了。但是kimi要技能冷却4小时，贤者时间太长。

--【拾捌】--：

--【拾玖】--： TOT:

五、结论

佬，有时间可以多来点这种对比测试啊，非常有用

标签：人工智能

一、环境及提示词

二、CC Cli结果对比

三、前端页面横向对比

四、项目架构对比

五、结论

相关推荐

一、环境及提示词

二、CC Cli结果对比

三、前端页面横向对比

四、项目架构对比

五、结论

相关推荐