GLM 5.1测评:第一梯队的敲门砖

2026-04-11 14:570阅读0评论SEO资源
  • 内容介绍
  • 文章标签
  • 相关推荐
问题描述:

先放bench
image947×418 9.03 KB
赶超了四个月前的模型opus 4.5(不过当时使用反重力测试的,可能会有一些差别)
但是和4.5系列一个梯队是没问题的

代码水平中等偏上
image550×550 45.3 KB
一些实现的想法很好,但会被小bug绊住
image1141×722 111 KB
bench内题目需要被返修的也显著减少
image775×583 42.2 KB

但是问题也很显著,GLM 5.1会在思维链中大量打草稿,导致经常爆思考。如果是出字了爆还能继续,在思维链里把token耗尽就只能reroll了

如果开源的话可以夸一夸智谱,如果闭源还涨价我要骂了()
image959×796 87.5 KB
现在有点试探市场反应的意味呢

网友解答:
--【壹】--: Ri Sy:

我不可能理解

这是何意


--【贰】--:

glm 5 turbo就没开


--【叁】--:

这个到可以理解。我怀疑GLM 5turbo本来就是GLM 5的一个延伸吧。不算开发的主流线。
话说回来,现在国外风控这么严。的确使用vibe coding渠道要多元化了,GLM 5.1可以进去考虑范围内了


--【肆】--:

我这可以超过 30 分钟,openclaw 自动运行调试代码,控制 Claude code 稳定运行 超过 30 分钟


--【伍】--:

你用过GLM 5.1 吗


--【陆】--:

总是开源的吧。GLM5我记得都是开源的。

阅读全文
标签:人工智能
问题描述:

先放bench
image947×418 9.03 KB
赶超了四个月前的模型opus 4.5(不过当时使用反重力测试的,可能会有一些差别)
但是和4.5系列一个梯队是没问题的

代码水平中等偏上
image550×550 45.3 KB
一些实现的想法很好,但会被小bug绊住
image1141×722 111 KB
bench内题目需要被返修的也显著减少
image775×583 42.2 KB

但是问题也很显著,GLM 5.1会在思维链中大量打草稿,导致经常爆思考。如果是出字了爆还能继续,在思维链里把token耗尽就只能reroll了

如果开源的话可以夸一夸智谱,如果闭源还涨价我要骂了()
image959×796 87.5 KB
现在有点试探市场反应的意味呢

网友解答:
--【壹】--: Ri Sy:

我不可能理解

这是何意


--【贰】--:

glm 5 turbo就没开


--【叁】--:

这个到可以理解。我怀疑GLM 5turbo本来就是GLM 5的一个延伸吧。不算开发的主流线。
话说回来,现在国外风控这么严。的确使用vibe coding渠道要多元化了,GLM 5.1可以进去考虑范围内了


--【肆】--:

我这可以超过 30 分钟,openclaw 自动运行调试代码,控制 Claude code 稳定运行 超过 30 分钟


--【伍】--:

你用过GLM 5.1 吗


--【陆】--:

总是开源的吧。GLM5我记得都是开源的。

阅读全文
标签:人工智能