GLM-5.1 Kimi-K2.6 Claude Opus4.7横评对比
- 内容介绍
- 文章标签
- 相关推荐
一、环境及提示词
订阅情况:
-
GLM-5.1 : 智谱国内站 新Max套餐(460元)。
-
Kimi-k2.6: kimi 199元档位套餐。
-
Claude Opus-4.7: Max满血中转(经测试未降智且支持1M上下文)。
本次测试中CC均设置为200K上下文窗口。毕竟这个小项目用不到1M。
提示词统一为:
为我规划一个2048网页小游戏,需要实现排行榜功能,按照用户脱敏IP进行排行,每个IP保留最高记录。
使用next.js + shadcn + tailwindcss + sqlite3 来实现。使用APP Router来实现后端接口。
CLI工具:
统一使用Claude Code v2.1.111
二、CC Cli结果对比
GLM-5.1最后的报错是因为我手动kill了npm run dev进程,来进行下一轮测试。
图片1920×1206 391 KB
对比结果
| 指标 | GLM-5.1 | Kimi-k2.6 | Claude Opus-4.7 |
|---|---|---|---|
| 耗费时间 | 19m58s | 14m22s | 3m21s |
| 完成时上下文窗口 | 33% | 16% | 19% |
| 备注 | 调用子 agent 并行文件写入 | -– | -– |
三、前端页面横向对比
从左至右,分别为GLM-5.1 、 Kimi-K2.6 、 Claude Opus 4.7
npm run dev启动,三个报错均为SSR问题。
图片1920×910 129 KB
四、项目架构对比
GLM-5.1 CC工作目录为 ~/Desktop/2048testglm/,目录架构如下:
➜ 2048testglm git:(main) ✗ tree -I 'node_modules|.git|.next' -L 4
.
├── AGENTS.md
├── app
│ ├── api
│ │ └── leaderboard
│ │ └── route.ts
│ ├── favicon.ico
│ ├── globals.css
│ ├── layout.tsx
│ └── page.tsx
├── CLAUDE.md
├── components
│ ├── game
│ │ ├── game-board.tsx
│ │ ├── game-container.tsx
│ │ ├── game-header.tsx
│ │ ├── game-over-overlay.tsx
│ │ └── game-tile.tsx
│ ├── leaderboard
│ │ └── leaderboard-table.tsx
│ └── ui
│ ├── button.tsx
│ ├── card.tsx
│ └── table.tsx
├── components.json
├── data
│ ├── game.db
│ ├── game.db-shm
│ └── game.db-wal
├── eslint.config.mjs
├── hooks
│ ├── use-game.ts
│ ├── use-keyboard.ts
│ └── use-touch.ts
├── lib
│ ├── db.ts
│ ├── game
│ │ ├── core.ts
│ │ └── types.ts
│ ├── ip.ts
│ ├── schema.sql
│ └── utils.ts
├── next-env.d.ts
├── next.config.ts
├── package-lock.json
├── package.json
├── postcss.config.mjs
├── public
│ ├── file.svg
│ ├── globe.svg
│ ├── next.svg
│ ├── vercel.svg
│ └── window.svg
├── README.md
└── tsconfig.json
13 directories, 42 files
Kimi-K2.6 CC工作目录为 ~/Desktop/2048testkimi/,目录架构如下:
➜ 2048testkimi tree -I 'node_modules|.git|.next' -L 4
.
└── my-app
├── AGENTS.md
├── CLAUDE.md
├── components.json
├── data
│ ├── scores.db
│ ├── scores.db-shm
│ └── scores.db-wal
├── eslint.config.mjs
├── next-env.d.ts
├── next.config.ts
├── package-lock.json
├── package.json
├── postcss.config.mjs
├── public
│ ├── file.svg
│ ├── globe.svg
│ ├── next.svg
│ ├── vercel.svg
│ └── window.svg
├── README.md
├── src
│ ├── app
│ │ ├── api
│ │ ├── favicon.ico
│ │ ├── globals.css
│ │ ├── layout.tsx
│ │ └── page.tsx
│ ├── components
│ │ ├── game-board.tsx
│ │ ├── leaderboard.tsx
│ │ └── ui
│ └── lib
│ ├── db.ts
│ ├── game-logic.ts
│ └── utils.ts
└── tsconfig.json
10 directories, 28 files
Claude Opus 4.7 CC工作目录为 ~/Desktop/2048testopus/,目录架构如下:
➜ 2048testopus git:(main) ✗ tree -I 'node_modules|.git|.next' -L 4
.
├── AGENTS.md
├── app
│ ├── api
│ │ └── scores
│ │ └── route.ts
│ ├── favicon.ico
│ ├── globals.css
│ ├── layout.tsx
│ └── page.tsx
├── CLAUDE.md
├── components
│ ├── game-board.tsx
│ ├── leaderboard.tsx
│ ├── tile.tsx
│ └── ui
│ ├── button.tsx
│ ├── card.tsx
│ ├── dialog.tsx
│ └── table.tsx
├── components.json
├── data
│ ├── scores.db
│ ├── scores.db-shm
│ └── scores.db-wal
├── eslint.config.mjs
├── lib
│ ├── db.ts
│ ├── game-logic.ts
│ └── utils.ts
├── next-env.d.ts
├── next.config.ts
├── package-lock.json
├── package.json
├── postcss.config.mjs
├── public
│ ├── file.svg
│ ├── globe.svg
│ ├── next.svg
│ ├── vercel.svg
│ └── window.svg
├── README.md
└── tsconfig.json
9 directories, 34 files
五、结论
小游戏大差不差。
- 本次测试中也只有Kimi-k2.6在
2048testkimi目录下使用shadcn初始化项目到了`2048testkimi/my-app`目录,其余模型正常。 - 今天刚买Kimi订阅时,第一轮对kimi-k2.6测试时出现了异常,一轮对话未正常完成项目规划和代码编写。但这轮并行测试时反倒输出的跟Opus 4.7很类似。
- 第一轮k2.6写的前端页面如下图,且后端报错未安装
better-sqlite3。
图片1382×1326 55.6 KB
网友解答:--【壹】--:
认真的吗?海外版的ZAI是18…美刀诶
虽然确实是18就是了
--【贰】--:
实话说,kimi k2.6连2048小游戏的实现都能出错,再去测试的意义不大了。等下一轮迭代吧。
GLM-5.1的效果还不错的,上周高强度用了一周。在CC上用,多轮压缩后结合memory,会话主线丢失不太多。最多单会话多轮跑过连续12小时的。
如果你能忍受智谱的token速度,那可以考虑使用GLM-5.1了。
况且GLM估计马上又要出新模型了。
图片2414×1136 231 KB
--【叁】--:
是的,不过即使是这种已经玩烂的场景,kimi k2.6的效果依然不稳定。
--【肆】--:
GPT的黑话是真的多,不过我一般让他做完后生成简报
不然是真看不懂
--【伍】--:
总结:
结果差不多,能干活,但是爱走弯路。
--【陆】--:
不要测试这种大众化的2048,这类小游戏太多人做过,这些大模型训练集里一大堆,让他们做等于让他们背出来。
至少要测一些不常见的需求(我暂时也没想出来)
--【柒】--:
GLM5.1有海外版18一个月,可以看看
--【捌】--:
从耗费时间来看,Claude Opus实在是太强了
--【玖】--:
每个月不要超过20是我的承受极限。
请不要这么贵好,不好?
--【拾】--: TOT:
测试未降智
佬,怎么测试是不是满血的中转站,有链接嘛?
--【拾壹】--:
偏向Opus,但思考的不多,容易漏细节。这方面不如GLM-5.1
--【拾贰】--:
kimi 没黑话吧 gpt的输出是真的难读
--【拾叁】--:
小功能测不出来,佬,整点复杂度高一点的需求试试呢。glm5.1我还没用过,但是5我感觉和gpt差距都很明显啊
--【拾肆】--:
GLM就是思考时间太长了,其他性价比来说没的说
opus太贵
--【拾伍】--:
大佬,Kimi遵循指令强吗,性格偏向于GPT还是Opus
--【拾陆】--:
唉,GLM-5.1如果有Kimi k2.6的token速度,何至于再去买个k2.6用。
智谱的算力不够,太慢了,8小时工作时间,输不了几次提示词就下班了
--【拾柒】--:
glm确实慢,下午让他帮忙翻译,每一段中间要卡个10分钟。
最后用kimi 2.6 agent集群半小时就搞定了。但是kimi要技能冷却4小时,贤者时间太长。
--【拾捌】--:
GLM-5.1不适合养虾, 太慢了。
拿来工作很不错的,模型也够用,而且还慢。
输完提示词可以去蹲个坑再换杯茶,
工作节奏不紧不慢的,脑袋能得到放松。
--【拾玖】--: TOT:
五、结论
佬,有时间可以多来点这种对比测试啊,非常有用
一、环境及提示词
订阅情况:
-
GLM-5.1 : 智谱国内站 新Max套餐(460元)。
-
Kimi-k2.6: kimi 199元档位套餐。
-
Claude Opus-4.7: Max满血中转(经测试未降智且支持1M上下文)。
本次测试中CC均设置为200K上下文窗口。毕竟这个小项目用不到1M。
提示词统一为:
为我规划一个2048网页小游戏,需要实现排行榜功能,按照用户脱敏IP进行排行,每个IP保留最高记录。
使用next.js + shadcn + tailwindcss + sqlite3 来实现。使用APP Router来实现后端接口。
CLI工具:
统一使用Claude Code v2.1.111
二、CC Cli结果对比
GLM-5.1最后的报错是因为我手动kill了npm run dev进程,来进行下一轮测试。
图片1920×1206 391 KB
对比结果
| 指标 | GLM-5.1 | Kimi-k2.6 | Claude Opus-4.7 |
|---|---|---|---|
| 耗费时间 | 19m58s | 14m22s | 3m21s |
| 完成时上下文窗口 | 33% | 16% | 19% |
| 备注 | 调用子 agent 并行文件写入 | -– | -– |
三、前端页面横向对比
从左至右,分别为GLM-5.1 、 Kimi-K2.6 、 Claude Opus 4.7
npm run dev启动,三个报错均为SSR问题。
图片1920×910 129 KB
四、项目架构对比
GLM-5.1 CC工作目录为 ~/Desktop/2048testglm/,目录架构如下:
➜ 2048testglm git:(main) ✗ tree -I 'node_modules|.git|.next' -L 4
.
├── AGENTS.md
├── app
│ ├── api
│ │ └── leaderboard
│ │ └── route.ts
│ ├── favicon.ico
│ ├── globals.css
│ ├── layout.tsx
│ └── page.tsx
├── CLAUDE.md
├── components
│ ├── game
│ │ ├── game-board.tsx
│ │ ├── game-container.tsx
│ │ ├── game-header.tsx
│ │ ├── game-over-overlay.tsx
│ │ └── game-tile.tsx
│ ├── leaderboard
│ │ └── leaderboard-table.tsx
│ └── ui
│ ├── button.tsx
│ ├── card.tsx
│ └── table.tsx
├── components.json
├── data
│ ├── game.db
│ ├── game.db-shm
│ └── game.db-wal
├── eslint.config.mjs
├── hooks
│ ├── use-game.ts
│ ├── use-keyboard.ts
│ └── use-touch.ts
├── lib
│ ├── db.ts
│ ├── game
│ │ ├── core.ts
│ │ └── types.ts
│ ├── ip.ts
│ ├── schema.sql
│ └── utils.ts
├── next-env.d.ts
├── next.config.ts
├── package-lock.json
├── package.json
├── postcss.config.mjs
├── public
│ ├── file.svg
│ ├── globe.svg
│ ├── next.svg
│ ├── vercel.svg
│ └── window.svg
├── README.md
└── tsconfig.json
13 directories, 42 files
Kimi-K2.6 CC工作目录为 ~/Desktop/2048testkimi/,目录架构如下:
➜ 2048testkimi tree -I 'node_modules|.git|.next' -L 4
.
└── my-app
├── AGENTS.md
├── CLAUDE.md
├── components.json
├── data
│ ├── scores.db
│ ├── scores.db-shm
│ └── scores.db-wal
├── eslint.config.mjs
├── next-env.d.ts
├── next.config.ts
├── package-lock.json
├── package.json
├── postcss.config.mjs
├── public
│ ├── file.svg
│ ├── globe.svg
│ ├── next.svg
│ ├── vercel.svg
│ └── window.svg
├── README.md
├── src
│ ├── app
│ │ ├── api
│ │ ├── favicon.ico
│ │ ├── globals.css
│ │ ├── layout.tsx
│ │ └── page.tsx
│ ├── components
│ │ ├── game-board.tsx
│ │ ├── leaderboard.tsx
│ │ └── ui
│ └── lib
│ ├── db.ts
│ ├── game-logic.ts
│ └── utils.ts
└── tsconfig.json
10 directories, 28 files
Claude Opus 4.7 CC工作目录为 ~/Desktop/2048testopus/,目录架构如下:
➜ 2048testopus git:(main) ✗ tree -I 'node_modules|.git|.next' -L 4
.
├── AGENTS.md
├── app
│ ├── api
│ │ └── scores
│ │ └── route.ts
│ ├── favicon.ico
│ ├── globals.css
│ ├── layout.tsx
│ └── page.tsx
├── CLAUDE.md
├── components
│ ├── game-board.tsx
│ ├── leaderboard.tsx
│ ├── tile.tsx
│ └── ui
│ ├── button.tsx
│ ├── card.tsx
│ ├── dialog.tsx
│ └── table.tsx
├── components.json
├── data
│ ├── scores.db
│ ├── scores.db-shm
│ └── scores.db-wal
├── eslint.config.mjs
├── lib
│ ├── db.ts
│ ├── game-logic.ts
│ └── utils.ts
├── next-env.d.ts
├── next.config.ts
├── package-lock.json
├── package.json
├── postcss.config.mjs
├── public
│ ├── file.svg
│ ├── globe.svg
│ ├── next.svg
│ ├── vercel.svg
│ └── window.svg
├── README.md
└── tsconfig.json
9 directories, 34 files
五、结论
小游戏大差不差。
- 本次测试中也只有Kimi-k2.6在
2048testkimi目录下使用shadcn初始化项目到了`2048testkimi/my-app`目录,其余模型正常。 - 今天刚买Kimi订阅时,第一轮对kimi-k2.6测试时出现了异常,一轮对话未正常完成项目规划和代码编写。但这轮并行测试时反倒输出的跟Opus 4.7很类似。
- 第一轮k2.6写的前端页面如下图,且后端报错未安装
better-sqlite3。
图片1382×1326 55.6 KB
网友解答:--【壹】--:
认真的吗?海外版的ZAI是18…美刀诶
虽然确实是18就是了
--【贰】--:
实话说,kimi k2.6连2048小游戏的实现都能出错,再去测试的意义不大了。等下一轮迭代吧。
GLM-5.1的效果还不错的,上周高强度用了一周。在CC上用,多轮压缩后结合memory,会话主线丢失不太多。最多单会话多轮跑过连续12小时的。
如果你能忍受智谱的token速度,那可以考虑使用GLM-5.1了。
况且GLM估计马上又要出新模型了。
图片2414×1136 231 KB
--【叁】--:
是的,不过即使是这种已经玩烂的场景,kimi k2.6的效果依然不稳定。
--【肆】--:
GPT的黑话是真的多,不过我一般让他做完后生成简报
不然是真看不懂
--【伍】--:
总结:
结果差不多,能干活,但是爱走弯路。
--【陆】--:
不要测试这种大众化的2048,这类小游戏太多人做过,这些大模型训练集里一大堆,让他们做等于让他们背出来。
至少要测一些不常见的需求(我暂时也没想出来)
--【柒】--:
GLM5.1有海外版18一个月,可以看看
--【捌】--:
从耗费时间来看,Claude Opus实在是太强了
--【玖】--:
每个月不要超过20是我的承受极限。
请不要这么贵好,不好?
--【拾】--: TOT:
测试未降智
佬,怎么测试是不是满血的中转站,有链接嘛?
--【拾壹】--:
偏向Opus,但思考的不多,容易漏细节。这方面不如GLM-5.1
--【拾贰】--:
kimi 没黑话吧 gpt的输出是真的难读
--【拾叁】--:
小功能测不出来,佬,整点复杂度高一点的需求试试呢。glm5.1我还没用过,但是5我感觉和gpt差距都很明显啊
--【拾肆】--:
GLM就是思考时间太长了,其他性价比来说没的说
opus太贵
--【拾伍】--:
大佬,Kimi遵循指令强吗,性格偏向于GPT还是Opus
--【拾陆】--:
唉,GLM-5.1如果有Kimi k2.6的token速度,何至于再去买个k2.6用。
智谱的算力不够,太慢了,8小时工作时间,输不了几次提示词就下班了
--【拾柒】--:
glm确实慢,下午让他帮忙翻译,每一段中间要卡个10分钟。
最后用kimi 2.6 agent集群半小时就搞定了。但是kimi要技能冷却4小时,贤者时间太长。
--【拾捌】--:
GLM-5.1不适合养虾, 太慢了。
拿来工作很不错的,模型也够用,而且还慢。
输完提示词可以去蹲个坑再换杯茶,
工作节奏不紧不慢的,脑袋能得到放松。
--【拾玖】--: TOT:
五、结论
佬,有时间可以多来点这种对比测试啊,非常有用

