GPT-5.5模型的Arena的评分排行出来了

2026-04-29 08:241阅读0评论SEO资源
  • 内容介绍
  • 文章标签
  • 相关推荐
问题描述:

从官方发文搬过来的,没想到的是代码这块居然会被glm、kimi压下去。详细内容如下:

IMG33291340×1344 164 KB
IMG33291340×1344 164 KB
IMG33311340×1344 169 KB
IMG33321340×1344 162 KB
IMG33331200×1077 85.9 KB
IMG33341200×1036 80.8 KB

网友解答:
--【壹】--:

看到GLM 5.1比sonnet 4.6高。我笑了笑没说话hh


--【贰】--:

这榜单看着很好笑,这编程能力估计测的都是前端的分数吧


--【叁】--:

这是 Hard Prompt 不是 Text 总榜


--【肆】--:

问题是我认识的老外没有几个现在不骂OPUS4.7的,因为也不说人话了,哈哈哈,都想用回OPUS4.6,国人也差不多


--【伍】--:

5.5还是干不过4.7?连4.6都干不过,这跟老友们的使用体验反馈结果有偏差啊。

阅读全文
问题描述:

从官方发文搬过来的,没想到的是代码这块居然会被glm、kimi压下去。详细内容如下:

IMG33291340×1344 164 KB
IMG33291340×1344 164 KB
IMG33311340×1344 169 KB
IMG33321340×1344 162 KB
IMG33331200×1077 85.9 KB
IMG33341200×1036 80.8 KB

网友解答:
--【壹】--:

看到GLM 5.1比sonnet 4.6高。我笑了笑没说话hh


--【贰】--:

这榜单看着很好笑,这编程能力估计测的都是前端的分数吧


--【叁】--:

这是 Hard Prompt 不是 Text 总榜


--【肆】--:

问题是我认识的老外没有几个现在不骂OPUS4.7的,因为也不说人话了,哈哈哈,都想用回OPUS4.6,国人也差不多


--【伍】--:

5.5还是干不过4.7?连4.6都干不过,这跟老友们的使用体验反馈结果有偏差啊。

阅读全文