glm5.1 测评-小结论国产第一（但是有时候会出现思考太久不输出的问题）。

2026-04-11 14:401阅读0评论SEO资源

内容介绍
文章标签
相关推荐

问题描述：

二十个文件，一次运行结果后无error直接build成功了，而且在初始化时说的配置信息能在结尾的时完整写入，build成功后开始用我的配置去测功能，修了几个问题。这在以前国内的模型是完全做不到的。

bc7eab78645634ee461779fc034f7af52346×1222 92.3 KB

运行环境：普通模式，没有任何内置提示词，没开plan，没有使用superpowers等skill。

单次运行，有概率是抽卡，后续我还会继续体验，glm5.1这次写入所有文件后build 0 error真的是惊艳到我了，以前到这一步其他模型最少也有十几个报错，然后为了修这个报错，那些模型就要反复改动，这次glm一次成功有一种指哪打哪的感觉。
运行的提示词如下：

https://github.com/MiniMax-AI/Mini-Agent 这是一个python仓库，你需要将它克隆在本地，并新建一个文件夹，Mini-Agent-TS，我需要能实现全部功能的ts版本的mini-agent。并在完成后测试全部功能。 key:xxx 模型：MiniMax-M2.7。url: https://api.minimax.io

==========
更新：

测评二

cf0b2116d3002cc978eaa57a5917e1fb2544×486 48.9 KB

出现了一直思考不输出的情况
提示词如下：

题目：单文件实现高性能、安全计算的响应式电子表格请在一个单文件 HTML 中（包含内部的 CSS 和 JS），使用纯原生 JavaScript 实现一个 100x100（10000个单元格）的响应式电子表格。请严格满足以下要求，禁止使用任何第三方库： 1. 界面与大规模渲染（性能测试点）：渲染一个包含表头（列标 A-CV，行标 1-100）的网格。性能要求：禁止为 10000 个单元格单独绑定事件，必须使用**事件委托（Event Delegation）**处理点击和输入。修改单个单元格时，禁止全量重新渲染 DOM，只能精确更新受影响的单元格节点。 2. 数据、公式与安全（编译原理测试点）：支持纯数字和公式（以 = 开头）。支持基本加减乘除（如 =A1+B2*2）。新增范围聚合函数：支持 SUM(start:end) 和 AVG(start:end)，例如 =SUM(A1:B3)，要求能正确展开二维范围内的所有单元格依赖。极度严格的安全要求：绝对禁止使用 eval()、new Function() 或 setTimeout 变体来执行公式计算。你必须实现一个微型的词法分析器/解析器（如调度场算法 Shunting-yard 或简单的 AST 解析）来计算数学表达式。 3. 核心算法要求（图论与健壮性）：级联响应式更新：实现精准的依赖追踪。A1 更新时，只有直接或间接依赖 A1 的单元格才触发重新计算和 DOM 更新。循环依赖检测：精准检测 A 依赖 B，B 依赖 A（或更深层环）。发现循环依赖时，相关单元格显示 !CYCLE 并中止计算，绝对不能引发调用栈溢出（Stack Overflow）。错误传播：如果 A1 出现错误（如 !CYCLE 或解析错误 !ERR），依赖 A1 的 C1 也应显示 !ERR。请确保 UI 简洁可用（建议给表格加上基础边框和高亮），代码结构清晰，严格遵守“禁止 eval”和“防死循环”的底线。 网友解答：

--【壹】--：

小版本这么强？

--【贰】--：

看来智谱有点东西啊

kimi-k3 ds-v4快来啊

--【叁】--：

听说比opus-4.6强，还没用过

--【肆】--：

都5.1了？怎么没听说啊？？？

--【伍】--：

这么牛吗

--【陆】--：

已经超过Kimi2.5了吗什么时候国产ai能到现阶段Claude4.6的水平铁支持，已经够我用了

--【柒】--：

API多少钱啊

--【捌】--：

瞻仰一下战况

--【玖】--：

好好，越强越好

--【拾】--：

这么强嘛

--【拾壹】--：

？！强强！？

--【拾贰】--：

真的那么厉害？

--【拾叁】--：

高开低走

--【拾肆】--：

希望后面不会降智

--【拾伍】--：

刚发布

--【拾陆】--：

这么强？

--【拾柒】--：

佬能不能放进claude cli试试

--【拾捌】--：

让子弹再飞一会儿。我已经被智谱的付费体验整怕了

--【拾玖】--：

5.1出来了？

标签：人工智能