GPT-5.5模型的Arena的评分排行出来了
- 内容介绍
- 文章标签
- 相关推荐
问题描述:
--【壹】--:
--【贰】--:
--【叁】--:
--【肆】--:
--【伍】--:
从官方发文搬过来的,没想到的是代码这块居然会被glm、kimi压下去。详细内容如下:
IMG33291340×1344 164 KB
IMG33291340×1344 164 KB
IMG33311340×1344 169 KB
IMG33321340×1344 162 KB
IMG33331200×1077 85.9 KB
IMG33341200×1036 80.8 KB
--【壹】--:
看到GLM 5.1比sonnet 4.6高。我笑了笑没说话hh
--【贰】--:
这榜单看着很好笑,这编程能力估计测的都是前端的分数吧
--【叁】--:
这是 Hard Prompt 不是 Text 总榜
--【肆】--:
问题是我认识的老外没有几个现在不骂OPUS4.7的,因为也不说人话了,哈哈哈,都想用回OPUS4.6,国人也差不多
--【伍】--:
5.5还是干不过4.7?连4.6都干不过,这跟老友们的使用体验反馈结果有偏差啊。
问题描述:
--【壹】--:
--【贰】--:
--【叁】--:
--【肆】--:
--【伍】--:
从官方发文搬过来的,没想到的是代码这块居然会被glm、kimi压下去。详细内容如下:
IMG33291340×1344 164 KB
IMG33291340×1344 164 KB
IMG33311340×1344 169 KB
IMG33321340×1344 162 KB
IMG33331200×1077 85.9 KB
IMG33341200×1036 80.8 KB
--【壹】--:
看到GLM 5.1比sonnet 4.6高。我笑了笑没说话hh
--【贰】--:
这榜单看着很好笑,这编程能力估计测的都是前端的分数吧
--【叁】--:
这是 Hard Prompt 不是 Text 总榜
--【肆】--:
问题是我认识的老外没有几个现在不骂OPUS4.7的,因为也不说人话了,哈哈哈,都想用回OPUS4.6,国人也差不多
--【伍】--:
5.5还是干不过4.7?连4.6都干不过,这跟老友们的使用体验反馈结果有偏差啊。

