Deepseek-V4-Pro & Flash 24点测试

2026-04-29 10:351阅读0评论SEO教程
  • 内容介绍
  • 文章标签
  • 相关推荐
问题描述:
提示词不要调用任何工具。计算一下 2578 这四个数字,怎么做 24 点?

Pro3.7s完成任务
而Flash一直在猜测,思考了100多s,我就懒得继续了,直接终止对话其实是怕本来不多的余额没了
Pro950×712 27.3 KB
Flash2148×1154 298 KB
GPT那边的回答见GPT 5.5 / Pro 你这让我怎么相信你?16+2=24 你怎么敢说的?做这个题你还不如阉割版o3(只有网页版!)
GPT那边回答这个问题很不稳定,照这样来看GPT完败?(至少在这个问题上)

网友解答:
--【壹】--:

可能oai是做了什么策略吧。简单的问题就偷懒,结果直接偷懒到回答不出来。而ds现在给我的感觉是,超级努力,宁可想多都不肯少想


--【贰】--:

给 OpenAI 的人反馈了,但不知道他们什么时候能修,哈哈


--【叁】--:

这个我同意,就是我没想到gpt为啥会答不出来


--【肆】--:

我还是比较喜欢 Deepseek 这种较真的思考


--【伍】--:

这个题目对于除了 GPT 以外的模型都没有什么意义,因为这个题太简单了,但这个题能恰好反映出网页版的 GPT 5.4 和 GPT 5.5 思维链调出问题了

问题描述:
提示词不要调用任何工具。计算一下 2578 这四个数字,怎么做 24 点?

Pro3.7s完成任务
而Flash一直在猜测,思考了100多s,我就懒得继续了,直接终止对话其实是怕本来不多的余额没了
Pro950×712 27.3 KB
Flash2148×1154 298 KB
GPT那边的回答见GPT 5.5 / Pro 你这让我怎么相信你?16+2=24 你怎么敢说的?做这个题你还不如阉割版o3(只有网页版!)
GPT那边回答这个问题很不稳定,照这样来看GPT完败?(至少在这个问题上)

网友解答:
--【壹】--:

可能oai是做了什么策略吧。简单的问题就偷懒,结果直接偷懒到回答不出来。而ds现在给我的感觉是,超级努力,宁可想多都不肯少想


--【贰】--:

给 OpenAI 的人反馈了,但不知道他们什么时候能修,哈哈


--【叁】--:

这个我同意,就是我没想到gpt为啥会答不出来


--【肆】--:

我还是比较喜欢 Deepseek 这种较真的思考


--【伍】--:

这个题目对于除了 GPT 以外的模型都没有什么意义,因为这个题太简单了,但这个题能恰好反映出网页版的 GPT 5.4 和 GPT 5.5 思维链调出问题了