GLM-5.1 Kimi-K2.6 Claude Opus4.7横评对比

2026-04-29 09:442阅读0评论SEO问题
  • 内容介绍
  • 文章标签
  • 相关推荐
问题描述:

一、环境及提示词

订阅情况:

  • GLM-5.1 : 智谱国内站 新Max套餐(460元)。

  • Kimi-k2.6: kimi 199元档位套餐。

  • Claude Opus-4.7: Max满血中转(经测试未降智且支持1M上下文)。

    本次测试中CC均设置为200K上下文窗口。毕竟这个小项目用不到1M。

提示词统一为:

为我规划一个2048网页小游戏,需要实现排行榜功能,按照用户脱敏IP进行排行,每个IP保留最高记录。
使用next.js + shadcn + tailwindcss + sqlite3 来实现。使用APP Router来实现后端接口。

CLI工具:
统一使用Claude Code v2.1.111

二、CC Cli结果对比

GLM-5.1最后的报错是因为我手动kill了npm run dev进程,来进行下一轮测试。

图片1920×1206 391 KB

对比结果

指标 GLM-5.1 Kimi-k2.6 Claude Opus-4.7
耗费时间 19m58s 14m22s 3m21s
完成时上下文窗口 33% 16% 19%
备注 调用子 agent 并行文件写入 -– -–

三、前端页面横向对比

从左至右,分别为GLM-5.1 、 Kimi-K2.6 、 Claude Opus 4.7
npm run dev启动,三个报错均为SSR问题。

图片1920×910 129 KB

四、项目架构对比

GLM-5.1 CC工作目录为 ~/Desktop/2048testglm/,目录架构如下:

➜ 2048testglm git:(main) ✗ tree -I 'node_modules|.git|.next' -L 4 . ├── AGENTS.md ├── app │ ├── api │ │ └── leaderboard │ │ └── route.ts │ ├── favicon.ico │ ├── globals.css │ ├── layout.tsx │ └── page.tsx ├── CLAUDE.md ├── components │ ├── game │ │ ├── game-board.tsx │ │ ├── game-container.tsx │ │ ├── game-header.tsx │ │ ├── game-over-overlay.tsx │ │ └── game-tile.tsx │ ├── leaderboard │ │ └── leaderboard-table.tsx │ └── ui │ ├── button.tsx │ ├── card.tsx │ └── table.tsx ├── components.json ├── data │ ├── game.db │ ├── game.db-shm │ └── game.db-wal ├── eslint.config.mjs ├── hooks │ ├── use-game.ts │ ├── use-keyboard.ts │ └── use-touch.ts ├── lib │ ├── db.ts │ ├── game │ │ ├── core.ts │ │ └── types.ts │ ├── ip.ts │ ├── schema.sql │ └── utils.ts ├── next-env.d.ts ├── next.config.ts ├── package-lock.json ├── package.json ├── postcss.config.mjs ├── public │ ├── file.svg │ ├── globe.svg │ ├── next.svg │ ├── vercel.svg │ └── window.svg ├── README.md └── tsconfig.json 13 directories, 42 files

Kimi-K2.6 CC工作目录为 ~/Desktop/2048testkimi/,目录架构如下:

➜ 2048testkimi tree -I 'node_modules|.git|.next' -L 4 . └── my-app ├── AGENTS.md ├── CLAUDE.md ├── components.json ├── data │ ├── scores.db │ ├── scores.db-shm │ └── scores.db-wal ├── eslint.config.mjs ├── next-env.d.ts ├── next.config.ts ├── package-lock.json ├── package.json ├── postcss.config.mjs ├── public │ ├── file.svg │ ├── globe.svg │ ├── next.svg │ ├── vercel.svg │ └── window.svg ├── README.md ├── src │ ├── app │ │ ├── api │ │ ├── favicon.ico │ │ ├── globals.css │ │ ├── layout.tsx │ │ └── page.tsx │ ├── components │ │ ├── game-board.tsx │ │ ├── leaderboard.tsx │ │ └── ui │ └── lib │ ├── db.ts │ ├── game-logic.ts │ └── utils.ts └── tsconfig.json 10 directories, 28 files

Claude Opus 4.7 CC工作目录为 ~/Desktop/2048testopus/,目录架构如下:

➜ 2048testopus git:(main) ✗ tree -I 'node_modules|.git|.next' -L 4 . ├── AGENTS.md ├── app │ ├── api │ │ └── scores │ │ └── route.ts │ ├── favicon.ico │ ├── globals.css │ ├── layout.tsx │ └── page.tsx ├── CLAUDE.md ├── components │ ├── game-board.tsx │ ├── leaderboard.tsx │ ├── tile.tsx │ └── ui │ ├── button.tsx │ ├── card.tsx │ ├── dialog.tsx │ └── table.tsx ├── components.json ├── data │ ├── scores.db │ ├── scores.db-shm │ └── scores.db-wal ├── eslint.config.mjs ├── lib │ ├── db.ts │ ├── game-logic.ts │ └── utils.ts ├── next-env.d.ts ├── next.config.ts ├── package-lock.json ├── package.json ├── postcss.config.mjs ├── public │ ├── file.svg │ ├── globe.svg │ ├── next.svg │ ├── vercel.svg │ └── window.svg ├── README.md └── tsconfig.json 9 directories, 34 files

五、结论

小游戏大差不差。

  1. 本次测试中也只有Kimi-k2.6在2048testkimi 目录下使用shadcn初始化项目到了`2048testkimi/my-app`目录,其余模型正常。
  2. 今天刚买Kimi订阅时,第一轮对kimi-k2.6测试时出现了异常,一轮对话未正常完成项目规划和代码编写。但这轮并行测试时反倒输出的跟Opus 4.7很类似。
  3. 第一轮k2.6写的前端页面如下图,且后端报错未安装better-sqlite3

图片1382×1326 55.6 KB

网友解答:
--【壹】--:

认真的吗?海外版的ZAI是18…美刀诶
虽然确实是18就是了


--【贰】--:

实话说,kimi k2.6连2048小游戏的实现都能出错,再去测试的意义不大了。等下一轮迭代吧。

GLM-5.1的效果还不错的,上周高强度用了一周。在CC上用,多轮压缩后结合memory,会话主线丢失不太多。最多单会话多轮跑过连续12小时的。

如果你能忍受智谱的token速度,那可以考虑使用GLM-5.1了。

况且GLM估计马上又要出新模型了。

图片2414×1136 231 KB


--【叁】--:

是的,不过即使是这种已经玩烂的场景,kimi k2.6的效果依然不稳定。


--【肆】--:

GPT的黑话是真的多,不过我一般让他做完后生成简报

不然是真看不懂


--【伍】--:

总结:
结果差不多,能干活,但是爱走弯路。


--【陆】--:

不要测试这种大众化的2048,这类小游戏太多人做过,这些大模型训练集里一大堆,让他们做等于让他们背出来。
至少要测一些不常见的需求(我暂时也没想出来)


--【柒】--:

GLM5.1有海外版18一个月,可以看看


--【捌】--:

从耗费时间来看,Claude Opus实在是太强了


--【玖】--:

每个月不要超过20是我的承受极限。
请不要这么贵好,不好?


--【拾】--: TOT:

测试未降智

佬,怎么测试是不是满血的中转站,有链接嘛?


--【拾壹】--:

偏向Opus,但思考的不多,容易漏细节。这方面不如GLM-5.1


--【拾贰】--:

kimi 没黑话吧 gpt的输出是真的难读


--【拾叁】--:

小功能测不出来,佬,整点复杂度高一点的需求试试呢。glm5.1我还没用过,但是5我感觉和gpt差距都很明显啊


--【拾肆】--:

GLM就是思考时间太长了,其他性价比来说没的说
opus太贵


--【拾伍】--:

大佬,Kimi遵循指令强吗,性格偏向于GPT还是Opus


--【拾陆】--:

唉,GLM-5.1如果有Kimi k2.6的token速度,何至于再去买个k2.6用。

智谱的算力不够,太慢了,8小时工作时间,输不了几次提示词就下班了


--【拾柒】--:

glm确实慢,下午让他帮忙翻译,每一段中间要卡个10分钟。
最后用kimi 2.6 agent集群半小时就搞定了。但是kimi要技能冷却4小时,贤者时间太长。


--【拾捌】--:

GLM-5.1不适合养虾, 太慢了。
拿来工作很不错的,模型也够用,而且还慢。
输完提示词可以去蹲个坑再换杯茶,
工作节奏不紧不慢的,脑袋能得到放松。


--【拾玖】--: TOT:

五、结论

佬,有时间可以多来点这种对比测试啊,非常有用

标签:人工智能
问题描述:

一、环境及提示词

订阅情况:

  • GLM-5.1 : 智谱国内站 新Max套餐(460元)。

  • Kimi-k2.6: kimi 199元档位套餐。

  • Claude Opus-4.7: Max满血中转(经测试未降智且支持1M上下文)。

    本次测试中CC均设置为200K上下文窗口。毕竟这个小项目用不到1M。

提示词统一为:

为我规划一个2048网页小游戏,需要实现排行榜功能,按照用户脱敏IP进行排行,每个IP保留最高记录。
使用next.js + shadcn + tailwindcss + sqlite3 来实现。使用APP Router来实现后端接口。

CLI工具:
统一使用Claude Code v2.1.111

二、CC Cli结果对比

GLM-5.1最后的报错是因为我手动kill了npm run dev进程,来进行下一轮测试。

图片1920×1206 391 KB

对比结果

指标 GLM-5.1 Kimi-k2.6 Claude Opus-4.7
耗费时间 19m58s 14m22s 3m21s
完成时上下文窗口 33% 16% 19%
备注 调用子 agent 并行文件写入 -– -–

三、前端页面横向对比

从左至右,分别为GLM-5.1 、 Kimi-K2.6 、 Claude Opus 4.7
npm run dev启动,三个报错均为SSR问题。

图片1920×910 129 KB

四、项目架构对比

GLM-5.1 CC工作目录为 ~/Desktop/2048testglm/,目录架构如下:

➜ 2048testglm git:(main) ✗ tree -I 'node_modules|.git|.next' -L 4 . ├── AGENTS.md ├── app │ ├── api │ │ └── leaderboard │ │ └── route.ts │ ├── favicon.ico │ ├── globals.css │ ├── layout.tsx │ └── page.tsx ├── CLAUDE.md ├── components │ ├── game │ │ ├── game-board.tsx │ │ ├── game-container.tsx │ │ ├── game-header.tsx │ │ ├── game-over-overlay.tsx │ │ └── game-tile.tsx │ ├── leaderboard │ │ └── leaderboard-table.tsx │ └── ui │ ├── button.tsx │ ├── card.tsx │ └── table.tsx ├── components.json ├── data │ ├── game.db │ ├── game.db-shm │ └── game.db-wal ├── eslint.config.mjs ├── hooks │ ├── use-game.ts │ ├── use-keyboard.ts │ └── use-touch.ts ├── lib │ ├── db.ts │ ├── game │ │ ├── core.ts │ │ └── types.ts │ ├── ip.ts │ ├── schema.sql │ └── utils.ts ├── next-env.d.ts ├── next.config.ts ├── package-lock.json ├── package.json ├── postcss.config.mjs ├── public │ ├── file.svg │ ├── globe.svg │ ├── next.svg │ ├── vercel.svg │ └── window.svg ├── README.md └── tsconfig.json 13 directories, 42 files

Kimi-K2.6 CC工作目录为 ~/Desktop/2048testkimi/,目录架构如下:

➜ 2048testkimi tree -I 'node_modules|.git|.next' -L 4 . └── my-app ├── AGENTS.md ├── CLAUDE.md ├── components.json ├── data │ ├── scores.db │ ├── scores.db-shm │ └── scores.db-wal ├── eslint.config.mjs ├── next-env.d.ts ├── next.config.ts ├── package-lock.json ├── package.json ├── postcss.config.mjs ├── public │ ├── file.svg │ ├── globe.svg │ ├── next.svg │ ├── vercel.svg │ └── window.svg ├── README.md ├── src │ ├── app │ │ ├── api │ │ ├── favicon.ico │ │ ├── globals.css │ │ ├── layout.tsx │ │ └── page.tsx │ ├── components │ │ ├── game-board.tsx │ │ ├── leaderboard.tsx │ │ └── ui │ └── lib │ ├── db.ts │ ├── game-logic.ts │ └── utils.ts └── tsconfig.json 10 directories, 28 files

Claude Opus 4.7 CC工作目录为 ~/Desktop/2048testopus/,目录架构如下:

➜ 2048testopus git:(main) ✗ tree -I 'node_modules|.git|.next' -L 4 . ├── AGENTS.md ├── app │ ├── api │ │ └── scores │ │ └── route.ts │ ├── favicon.ico │ ├── globals.css │ ├── layout.tsx │ └── page.tsx ├── CLAUDE.md ├── components │ ├── game-board.tsx │ ├── leaderboard.tsx │ ├── tile.tsx │ └── ui │ ├── button.tsx │ ├── card.tsx │ ├── dialog.tsx │ └── table.tsx ├── components.json ├── data │ ├── scores.db │ ├── scores.db-shm │ └── scores.db-wal ├── eslint.config.mjs ├── lib │ ├── db.ts │ ├── game-logic.ts │ └── utils.ts ├── next-env.d.ts ├── next.config.ts ├── package-lock.json ├── package.json ├── postcss.config.mjs ├── public │ ├── file.svg │ ├── globe.svg │ ├── next.svg │ ├── vercel.svg │ └── window.svg ├── README.md └── tsconfig.json 9 directories, 34 files

五、结论

小游戏大差不差。

  1. 本次测试中也只有Kimi-k2.6在2048testkimi 目录下使用shadcn初始化项目到了`2048testkimi/my-app`目录,其余模型正常。
  2. 今天刚买Kimi订阅时,第一轮对kimi-k2.6测试时出现了异常,一轮对话未正常完成项目规划和代码编写。但这轮并行测试时反倒输出的跟Opus 4.7很类似。
  3. 第一轮k2.6写的前端页面如下图,且后端报错未安装better-sqlite3

图片1382×1326 55.6 KB

网友解答:
--【壹】--:

认真的吗?海外版的ZAI是18…美刀诶
虽然确实是18就是了


--【贰】--:

实话说,kimi k2.6连2048小游戏的实现都能出错,再去测试的意义不大了。等下一轮迭代吧。

GLM-5.1的效果还不错的,上周高强度用了一周。在CC上用,多轮压缩后结合memory,会话主线丢失不太多。最多单会话多轮跑过连续12小时的。

如果你能忍受智谱的token速度,那可以考虑使用GLM-5.1了。

况且GLM估计马上又要出新模型了。

图片2414×1136 231 KB


--【叁】--:

是的,不过即使是这种已经玩烂的场景,kimi k2.6的效果依然不稳定。


--【肆】--:

GPT的黑话是真的多,不过我一般让他做完后生成简报

不然是真看不懂


--【伍】--:

总结:
结果差不多,能干活,但是爱走弯路。


--【陆】--:

不要测试这种大众化的2048,这类小游戏太多人做过,这些大模型训练集里一大堆,让他们做等于让他们背出来。
至少要测一些不常见的需求(我暂时也没想出来)


--【柒】--:

GLM5.1有海外版18一个月,可以看看


--【捌】--:

从耗费时间来看,Claude Opus实在是太强了


--【玖】--:

每个月不要超过20是我的承受极限。
请不要这么贵好,不好?


--【拾】--: TOT:

测试未降智

佬,怎么测试是不是满血的中转站,有链接嘛?


--【拾壹】--:

偏向Opus,但思考的不多,容易漏细节。这方面不如GLM-5.1


--【拾贰】--:

kimi 没黑话吧 gpt的输出是真的难读


--【拾叁】--:

小功能测不出来,佬,整点复杂度高一点的需求试试呢。glm5.1我还没用过,但是5我感觉和gpt差距都很明显啊


--【拾肆】--:

GLM就是思考时间太长了,其他性价比来说没的说
opus太贵


--【拾伍】--:

大佬,Kimi遵循指令强吗,性格偏向于GPT还是Opus


--【拾陆】--:

唉,GLM-5.1如果有Kimi k2.6的token速度,何至于再去买个k2.6用。

智谱的算力不够,太慢了,8小时工作时间,输不了几次提示词就下班了


--【拾柒】--:

glm确实慢,下午让他帮忙翻译,每一段中间要卡个10分钟。
最后用kimi 2.6 agent集群半小时就搞定了。但是kimi要技能冷却4小时,贤者时间太长。


--【拾捌】--:

GLM-5.1不适合养虾, 太慢了。
拿来工作很不错的,模型也够用,而且还慢。
输完提示词可以去蹲个坑再换杯茶,
工作节奏不紧不慢的,脑袋能得到放松。


--【拾玖】--: TOT:

五、结论

佬,有时间可以多来点这种对比测试啊,非常有用

标签:人工智能