GPT-5.5模型的Arena的评分排行出来了

2026-04-29 08:241阅读0评论SEO资源

内容介绍
文章标签
相关推荐

问题描述：

从官方发文搬过来的，没想到的是代码这块居然会被glm、kimi压下去。详细内容如下：

IMG33291340×1344 164 KB
IMG33291340×1344 164 KB
IMG33311340×1344 169 KB
IMG33321340×1344 162 KB
IMG33331200×1077 85.9 KB
IMG33341200×1036 80.8 KB

网友解答：

--【壹】--：

看到GLM 5.1比sonnet 4.6高。我笑了笑没说话hh

--【贰】--：

这榜单看着很好笑，这编程能力估计测的都是前端的分数吧

--【叁】--：

这是 Hard Prompt 不是 Text 总榜

--【肆】--：

问题是我认识的老外没有几个现在不骂OPUS4.7的，因为也不说人话了，哈哈哈，都想用回OPUS4.6，国人也差不多

--【伍】--：

5.5还是干不过4.7？连4.6都干不过，这跟老友们的使用体验反馈结果有偏差啊。

标签：OpenAI 人工智能

问题描述：

从官方发文搬过来的，没想到的是代码这块居然会被glm、kimi压下去。详细内容如下：

IMG33291340×1344 164 KB
IMG33291340×1344 164 KB
IMG33311340×1344 169 KB
IMG33321340×1344 162 KB
IMG33331200×1077 85.9 KB
IMG33341200×1036 80.8 KB

网友解答：

--【壹】--：

看到GLM 5.1比sonnet 4.6高。我笑了笑没说话hh

--【贰】--：

这榜单看着很好笑，这编程能力估计测的都是前端的分数吧

--【叁】--：

这是 Hard Prompt 不是 Text 总榜

--【肆】--：

问题是我认识的老外没有几个现在不骂OPUS4.7的，因为也不说人话了，哈哈哈，都想用回OPUS4.6，国人也差不多

--【伍】--：

5.5还是干不过4.7？连4.6都干不过，这跟老友们的使用体验反馈结果有偏差啊。

标签：OpenAI 人工智能