关于gpt5.5个人一点小的测试
- 内容介绍
- 文章标签
- 相关推荐
在一个黑色的袋子里放有三种口味的糖果,每种糖果有两种不同的形状(圆形和五角星形,不同的形状靠手感可以分辨)。现已知不同口味的糖和不同形状的数量统计如下表。参赛者需要在活动前决定摸出的糖果数目,那么,最少取出多少个糖果才能保证手中同时拥有不同形状的苹果味和桃子味的糖?(同时手中有圆形苹果味匹配五角星桃子味糖果,或者有圆形桃子味匹配五角星苹果味糖果都满足要求)
苹果味 桃子味 西瓜味
圆形 7 9 8
五角星形 7 6 4
用来跑上述问题
测试账号 Pro订阅
IP 一致
Codex5.4 xhigh 回复正确答案21
Codex5.5 xhigh 回复29
Codex在加上 你必须要深度思考这个问题后 回复正确答案21
APP中1分钟不到就可以回答出正确答案21 遥遥领先
APIKEY方式指定5.5大概率是和账号是一样的 也就是说可以通过该配置文件来使用5.5具体可以用这个题目进行测试
image1920×1475 191 KB
粗浅结论:
5.5比5.4更像一个人,5.4是以理论来解决问题,而5.5是实践来解决问题。
代码层面:5.5的测试变多了 会积极读取上下文(不知道是不是错觉运行两次15分钟任务都积极读取) 减少了专业废话 速度感觉上是比5.4有所提升的 如果要用5.5写文档那些我觉得 你必须要深度思考这个问题 这几个字是很有必要加上的 不然他会迅速的完成任务就算你是xhigh他也是不思考 5.4更像一个完美主义的逻辑大师 5.5更像是一个实践派先做再测
网友解答:--【壹】--:
这图里面名字是宝可梦的,但是图片肯定不是,包括这个乌漆麻黑的精灵球?也不是
--【贰】--:
codex 5.5 high
image772×882 20.8 KB
--【叁】--:
cc里测试的 5.5xhigh
图片956×612 21.8 KB
--【肆】--:
image1487×837 196 KB
能看出来这是个啥不
--【伍】--:
创建一个骑自行车的鹈鹕的3D像素艺术作品。尽可能将场景刻画得非常细致,注意主体模型上的每一个小细节,同时也要考虑周围环境的细节。在一个HTML代码块中完成制作,将代码写得足够优秀,以展示你的水平超越其他作品。我赋予你完全的创作自由,尽情发挥。
--【陆】--:
App不到一分钟就思考出了21,没有加必须深度思考
Screenshot2026-04-24-07-29-55-0096b26121e545231a3c569311a54cda961440×3168 291 KB
--【柒】--:
image989×589 40.5 KB
感觉有个拉胯, 这个是宝可梦吗
--【捌】--:
codex cli 5.5 xhigh 没加必须深度思考:
PixPin2026-04-2413-19-21901×1436 187 KB
加了必须深度思考:
PixPin2026-04-2413-24-091250×2428 409 KB
--【玖】--: 诺河:
测试变多了 会积极读取上下文(不知道是不是错觉运行两次15分钟任务都积极读取) 减少了专业废话 速度感觉上是比5.4
5.5 还能稳稳的接住吗,还我先不猜吗?
在一个黑色的袋子里放有三种口味的糖果,每种糖果有两种不同的形状(圆形和五角星形,不同的形状靠手感可以分辨)。现已知不同口味的糖和不同形状的数量统计如下表。参赛者需要在活动前决定摸出的糖果数目,那么,最少取出多少个糖果才能保证手中同时拥有不同形状的苹果味和桃子味的糖?(同时手中有圆形苹果味匹配五角星桃子味糖果,或者有圆形桃子味匹配五角星苹果味糖果都满足要求)
苹果味 桃子味 西瓜味
圆形 7 9 8
五角星形 7 6 4
用来跑上述问题
测试账号 Pro订阅
IP 一致
Codex5.4 xhigh 回复正确答案21
Codex5.5 xhigh 回复29
Codex在加上 你必须要深度思考这个问题后 回复正确答案21
APP中1分钟不到就可以回答出正确答案21 遥遥领先
APIKEY方式指定5.5大概率是和账号是一样的 也就是说可以通过该配置文件来使用5.5具体可以用这个题目进行测试
image1920×1475 191 KB
粗浅结论:
5.5比5.4更像一个人,5.4是以理论来解决问题,而5.5是实践来解决问题。
代码层面:5.5的测试变多了 会积极读取上下文(不知道是不是错觉运行两次15分钟任务都积极读取) 减少了专业废话 速度感觉上是比5.4有所提升的 如果要用5.5写文档那些我觉得 你必须要深度思考这个问题 这几个字是很有必要加上的 不然他会迅速的完成任务就算你是xhigh他也是不思考 5.4更像一个完美主义的逻辑大师 5.5更像是一个实践派先做再测
网友解答:--【壹】--:
这图里面名字是宝可梦的,但是图片肯定不是,包括这个乌漆麻黑的精灵球?也不是
--【贰】--:
codex 5.5 high
image772×882 20.8 KB
--【叁】--:
cc里测试的 5.5xhigh
图片956×612 21.8 KB
--【肆】--:
image1487×837 196 KB
能看出来这是个啥不
--【伍】--:
创建一个骑自行车的鹈鹕的3D像素艺术作品。尽可能将场景刻画得非常细致,注意主体模型上的每一个小细节,同时也要考虑周围环境的细节。在一个HTML代码块中完成制作,将代码写得足够优秀,以展示你的水平超越其他作品。我赋予你完全的创作自由,尽情发挥。
--【陆】--:
App不到一分钟就思考出了21,没有加必须深度思考
Screenshot2026-04-24-07-29-55-0096b26121e545231a3c569311a54cda961440×3168 291 KB
--【柒】--:
image989×589 40.5 KB
感觉有个拉胯, 这个是宝可梦吗
--【捌】--:
codex cli 5.5 xhigh 没加必须深度思考:
PixPin2026-04-2413-19-21901×1436 187 KB
加了必须深度思考:
PixPin2026-04-2413-24-091250×2428 409 KB
--【玖】--: 诺河:
测试变多了 会积极读取上下文(不知道是不是错觉运行两次15分钟任务都积极读取) 减少了专业废话 速度感觉上是比5.4
5.5 还能稳稳的接住吗,还我先不猜吗?

