GPT 5.5 的 juice 真有 192吗?这更像一个谎言。

2026-04-29 08:051阅读0评论SEO资源
  • 内容介绍
  • 文章标签
  • 相关推荐
问题描述:

作为一个在读博士,我经常会思考和询问复杂的数理问题。我在5.4时代就发现,5.4在解决复杂问题时远不如5.2。那时我测的5.4的juice是96。
大家都说5.5的juice有192,我用prompt测试回答的也是192。但它真有这么聪明吗?
我询问5.5和5.2相同的问题,一个我非常确定thinking的一条回答解决不了的问题。
image1353×383 10.5 KB
image1073×587 15.5 KB

可以很直接地看出,回答的时间和思维链长度有极其明显的差别。
不仅如此,5.5的回答可以说毫无质量可言,基本上相当于对目前的研究进展做了个综述。
这点,gemini的回答也印证了我的判断
image975×622 68.4 KB

可以看出,OAI为了降本增效脸都不要了。我倒宁愿它能给少一点用量,但要保证回答的质量。

网友解答:
--【壹】--:

非常认可,之前用网页版来辅助写论文非常好用,现在的5.5虽然回答得快且说人话了,但质量下降太多了


--【贰】--:

我也是这个感觉,讨厌死了,做文字多步推理他是一点都不思考,秒拉屎,一大坨。就给出那种类似综述,简单介绍一下是怎么样太表层了。想做指令约束回答也很难,写好的约束给Claude执行效果巨好,给GPT让我有一种想扔垃圾桶再也不想用的感觉。从GPT5.3开始我就很难受了,GPT5.2是可以的,Pro模型还行,可能这就是实打实算力的感觉吧。

阅读全文
问题描述:

作为一个在读博士,我经常会思考和询问复杂的数理问题。我在5.4时代就发现,5.4在解决复杂问题时远不如5.2。那时我测的5.4的juice是96。
大家都说5.5的juice有192,我用prompt测试回答的也是192。但它真有这么聪明吗?
我询问5.5和5.2相同的问题,一个我非常确定thinking的一条回答解决不了的问题。
image1353×383 10.5 KB
image1073×587 15.5 KB

可以很直接地看出,回答的时间和思维链长度有极其明显的差别。
不仅如此,5.5的回答可以说毫无质量可言,基本上相当于对目前的研究进展做了个综述。
这点,gemini的回答也印证了我的判断
image975×622 68.4 KB

可以看出,OAI为了降本增效脸都不要了。我倒宁愿它能给少一点用量,但要保证回答的质量。

网友解答:
--【壹】--:

非常认可,之前用网页版来辅助写论文非常好用,现在的5.5虽然回答得快且说人话了,但质量下降太多了


--【贰】--:

我也是这个感觉,讨厌死了,做文字多步推理他是一点都不思考,秒拉屎,一大坨。就给出那种类似综述,简单介绍一下是怎么样太表层了。想做指令约束回答也很难,写好的约束给Claude执行效果巨好,给GPT让我有一种想扔垃圾桶再也不想用的感觉。从GPT5.3开始我就很难受了,GPT5.2是可以的,Pro模型还行,可能这就是实打实算力的感觉吧。

阅读全文