GPT 5.5测评:高效的推理和搞笑的能力

2026-04-29 10:331阅读0评论SEO问题
  • 内容介绍
  • 文章标签
  • 相关推荐
问题描述:

先放私有bench
image953×418 8.42 KB

GPT 5.5涨价了一倍,根据官方说法推理效率更高了。确实如此,5.4时期需要700甚至1000+秒思考的题目,现在400秒就写完了。但代价就是质量并不如5.4思考1000秒写出来的
image1242×801 261 KB
image1485×684 239 KB
image989×602 132 KB
或多或少都存在一些缺陷,整体质量不如5.4。

据传参数量也变大了,是oai目前第二大参数量的模型,可能在知识库和其他方面有所提升,但是预期代码感觉会比5.4更蠢,而且不说人话的毛病虽然改了些,但似乎还是一股味。

总体来说,对不起这个价格

——————————
四月份似乎所有厂商都拉了啊

Claude Opus 4.7测评:拉完了,达里奥也有自己的G 3 Pro 开发调优
先放私有bench [image] 到4.17号早上,佬们的各种骂声已经淹没L站了,就不多描述他的其他拉了 放一些结果 [image] 单说这个宝塔我说不如很多国模 [image] 渲染问题在往届没有过 [image] 审美也是区区的 而且这一代的思考时间极其长,堪比GPT,给我断流好几次 甚至知识库都更弱了 [image] 你如果说这是sonnet,…

kimi2.6测出来也是小范围蠕动。

阅读全文
问题描述:

先放私有bench
image953×418 8.42 KB

GPT 5.5涨价了一倍,根据官方说法推理效率更高了。确实如此,5.4时期需要700甚至1000+秒思考的题目,现在400秒就写完了。但代价就是质量并不如5.4思考1000秒写出来的
image1242×801 261 KB
image1485×684 239 KB
image989×602 132 KB
或多或少都存在一些缺陷,整体质量不如5.4。

据传参数量也变大了,是oai目前第二大参数量的模型,可能在知识库和其他方面有所提升,但是预期代码感觉会比5.4更蠢,而且不说人话的毛病虽然改了些,但似乎还是一股味。

总体来说,对不起这个价格

——————————
四月份似乎所有厂商都拉了啊

Claude Opus 4.7测评:拉完了,达里奥也有自己的G 3 Pro 开发调优
先放私有bench [image] 到4.17号早上,佬们的各种骂声已经淹没L站了,就不多描述他的其他拉了 放一些结果 [image] 单说这个宝塔我说不如很多国模 [image] 渲染问题在往届没有过 [image] 审美也是区区的 而且这一代的思考时间极其长,堪比GPT,给我断流好几次 甚至知识库都更弱了 [image] 你如果说这是sonnet,…

kimi2.6测出来也是小范围蠕动。

阅读全文