glm5.1 测评-小结论国产第一(但是有时候会出现思考太久不输出的问题)。
- 内容介绍
- 文章标签
- 相关推荐
二十个文件,一次运行结果后无error直接build成功了,而且在初始化时说的配置信息能在结尾的时完整写入,build成功后开始用我的配置去测功能,修了几个问题。这在以前国内的模型是完全做不到的。
bc7eab78645634ee461779fc034f7af52346×1222 92.3 KB
运行环境:普通模式,没有任何内置提示词,没开plan,没有使用superpowers等skill。
单次运行,有概率是抽卡,后续我还会继续体验,glm5.1这次写入所有文件后build 0 error真的是惊艳到我了,以前到这一步其他模型最少也有十几个报错,然后为了修这个报错,那些模型就要反复改动,这次glm一次成功有一种指哪打哪的感觉。
运行的提示词如下:
https://github.com/MiniMax-AI/Mini-Agent 这是一个python仓库,你需要将它克隆在本地,并新建一个文件夹,Mini-Agent-TS,我需要能实现全部功能的ts版本的mini-agent。并在完成后测试全部功能。
key:xxx 模型:MiniMax-M2.7。url: https://api.minimax.io
==========
更新:
测评二
cf0b2116d3002cc978eaa57a5917e1fb2544×486 48.9 KB
出现了一直思考不输出的情况
提示词如下:
题目:单文件实现高性能、安全计算的响应式电子表格
请在一个单文件 HTML 中(包含内部的 CSS 和 JS),使用纯原生 JavaScript 实现一个 100x100(10000个单元格) 的响应式电子表格。请严格满足以下要求,禁止使用任何第三方库:
1. 界面与大规模渲染(性能测试点):
渲染一个包含表头(列标 A-CV,行标 1-100)的网格。
性能要求:禁止为 10000 个单元格单独绑定事件,必须使用**事件委托(Event Delegation)**处理点击和输入。修改单个单元格时,禁止全量重新渲染 DOM,只能精确更新受影响的单元格节点。
2. 数据、公式与安全(编译原理测试点):
支持纯数字和公式(以 = 开头)。
支持基本加减乘除(如 =A1+B2*2)。
新增范围聚合函数:支持 SUM(start:end) 和 AVG(start:end),例如 =SUM(A1:B3),要求能正确展开二维范围内的所有单元格依赖。
极度严格的安全要求:绝对禁止使用 eval()、new Function() 或 setTimeout 变体来执行公式计算。 你必须实现一个微型的词法分析器/解析器(如调度场算法 Shunting-yard 或简单的 AST 解析)来计算数学表达式。
3. 核心算法要求(图论与健壮性):
级联响应式更新:实现精准的依赖追踪。A1 更新时,只有直接或间接依赖 A1 的单元格才触发重新计算和 DOM 更新。
循环依赖检测:精准检测 A 依赖 B,B 依赖 A(或更深层环)。发现循环依赖时,相关单元格显示 !CYCLE 并中止计算,绝对不能引发调用栈溢出(Stack Overflow)。
错误传播:如果 A1 出现错误(如 !CYCLE 或解析错误 !ERR),依赖 A1 的 C1 也应显示 !ERR。
请确保 UI 简洁可用(建议给表格加上基础边框和高亮),代码结构清晰,严格遵守“禁止 eval”和“防死循环”的底线。
网友解答:
--【壹】--:
小版本这么强?
--【贰】--:
看来智谱有点东西啊
kimi-k3 ds-v4快来啊
--【叁】--:
听说比opus-4.6强,还没用过
--【肆】--:
都5.1了?怎么没听说啊???
--【伍】--:
这么牛吗
--【陆】--:
已经超过Kimi2.5了吗 什么时候国产ai能到现阶段Claude4.6的水平铁支持,已经够我用了
--【柒】--:
API多少钱啊
--【捌】--:
瞻仰一下战况
--【玖】--:
好好,越强越好
--【拾】--:
这么强嘛
--【拾壹】--:
?!强强!?
--【拾贰】--:
真的那么厉害?
--【拾叁】--:
高开低走
--【拾肆】--:
希望后面不会降智
--【拾伍】--:
刚发布
--【拾陆】--:
这么强?
--【拾柒】--:
佬能不能放进claude cli试试
--【拾捌】--:
让子弹再飞一会儿。我已经被智谱的付费体验整怕了
--【拾玖】--:
5.1出来了?
二十个文件,一次运行结果后无error直接build成功了,而且在初始化时说的配置信息能在结尾的时完整写入,build成功后开始用我的配置去测功能,修了几个问题。这在以前国内的模型是完全做不到的。
bc7eab78645634ee461779fc034f7af52346×1222 92.3 KB
运行环境:普通模式,没有任何内置提示词,没开plan,没有使用superpowers等skill。
单次运行,有概率是抽卡,后续我还会继续体验,glm5.1这次写入所有文件后build 0 error真的是惊艳到我了,以前到这一步其他模型最少也有十几个报错,然后为了修这个报错,那些模型就要反复改动,这次glm一次成功有一种指哪打哪的感觉。
运行的提示词如下:
https://github.com/MiniMax-AI/Mini-Agent 这是一个python仓库,你需要将它克隆在本地,并新建一个文件夹,Mini-Agent-TS,我需要能实现全部功能的ts版本的mini-agent。并在完成后测试全部功能。
key:xxx 模型:MiniMax-M2.7。url: https://api.minimax.io
==========
更新:
测评二
cf0b2116d3002cc978eaa57a5917e1fb2544×486 48.9 KB
出现了一直思考不输出的情况
提示词如下:
题目:单文件实现高性能、安全计算的响应式电子表格
请在一个单文件 HTML 中(包含内部的 CSS 和 JS),使用纯原生 JavaScript 实现一个 100x100(10000个单元格) 的响应式电子表格。请严格满足以下要求,禁止使用任何第三方库:
1. 界面与大规模渲染(性能测试点):
渲染一个包含表头(列标 A-CV,行标 1-100)的网格。
性能要求:禁止为 10000 个单元格单独绑定事件,必须使用**事件委托(Event Delegation)**处理点击和输入。修改单个单元格时,禁止全量重新渲染 DOM,只能精确更新受影响的单元格节点。
2. 数据、公式与安全(编译原理测试点):
支持纯数字和公式(以 = 开头)。
支持基本加减乘除(如 =A1+B2*2)。
新增范围聚合函数:支持 SUM(start:end) 和 AVG(start:end),例如 =SUM(A1:B3),要求能正确展开二维范围内的所有单元格依赖。
极度严格的安全要求:绝对禁止使用 eval()、new Function() 或 setTimeout 变体来执行公式计算。 你必须实现一个微型的词法分析器/解析器(如调度场算法 Shunting-yard 或简单的 AST 解析)来计算数学表达式。
3. 核心算法要求(图论与健壮性):
级联响应式更新:实现精准的依赖追踪。A1 更新时,只有直接或间接依赖 A1 的单元格才触发重新计算和 DOM 更新。
循环依赖检测:精准检测 A 依赖 B,B 依赖 A(或更深层环)。发现循环依赖时,相关单元格显示 !CYCLE 并中止计算,绝对不能引发调用栈溢出(Stack Overflow)。
错误传播:如果 A1 出现错误(如 !CYCLE 或解析错误 !ERR),依赖 A1 的 C1 也应显示 !ERR。
请确保 UI 简洁可用(建议给表格加上基础边框和高亮),代码结构清晰,严格遵守“禁止 eval”和“防死循环”的底线。
网友解答:
--【壹】--:
小版本这么强?
--【贰】--:
看来智谱有点东西啊
kimi-k3 ds-v4快来啊
--【叁】--:
听说比opus-4.6强,还没用过
--【肆】--:
都5.1了?怎么没听说啊???
--【伍】--:
这么牛吗
--【陆】--:
已经超过Kimi2.5了吗 什么时候国产ai能到现阶段Claude4.6的水平铁支持,已经够我用了
--【柒】--:
API多少钱啊
--【捌】--:
瞻仰一下战况
--【玖】--:
好好,越强越好
--【拾】--:
这么强嘛
--【拾壹】--:
?!强强!?
--【拾贰】--:
真的那么厉害?
--【拾叁】--:
高开低走
--【拾肆】--:
希望后面不会降智
--【拾伍】--:
刚发布
--【拾陆】--:
这么强?
--【拾柒】--:
佬能不能放进claude cli试试
--【拾捌】--:
让子弹再飞一会儿。我已经被智谱的付费体验整怕了
--【拾玖】--:
5.1出来了?

