Gemini 3.1 Pro拿下竞赛数学题,目前唯一答对的
- 内容介绍
- 文章标签
- 相关推荐
题目:3. 设 n 是正整数. 有 n 张红色卡片与 n 张蓝色卡片, 最初每张红色卡片上都写有一个实数 0, 每张蓝色卡片上都写有一个实数 1. 一次操作是指: 选择一张红色卡片与一张蓝色卡片, 满足红色卡片上的实数 x 小于蓝色卡片上的实数 y, 将这两个实数擦去, 并在这两张卡片上都写下实数 \frac{x+y}{2}.
求最小的正整数 n, 使得可以适当地进行有限次操作, 让所有 n 张红色卡片上的实数之和大于 100.
中文回答,公式用$包裹,输出详细解析。这是一道极其困难,极其具有误导性的顶级竞赛题目,你必须最大化思考强度才有可能做出来。禁止联网搜索
Gemini 3.1 Pro(官网):
image745×3010 362 KB
其它AI的解答:
Grok 4.20(4 Agents)
image819×1140 159 KB
GPT 5.2 Thinking:
(超出思维链长度限制,无法输出,反复测试都是这个样子)、
DeepSeek V3.2 Speciale:
(官渠API,思考了2000秒)
image2185×2950 415 KB
Kimi K2.5:
image747×2004 55.6 KB
--【壹】--:
补充:
sonnet4.6 也做对了,虽然。。。
image1586×318 19.1 KB
image1552×488 48.3 KB
gpt 拉完了
image1396×422 24.8 KB
--【贰】--:
Screenshot_2026-02-20-10-07-06-914_com.ss.android.lark-edit956×2400 229 KB
--【叁】--:
有人測試編碼體驗怎麼樣嗎
--【肆】--:
5.2Thinking花了20多分钟没做对,还因为思维链过长没能输出,3.1直接几分钟做出来了
--【伍】--:
qwen拉了
image1518×714 93.6 KB
--【陆】--:
昨天测了现实问题,也是第一,而且不废话其他的
--【柒】--:
刚出的时候测的
--【捌】--:
Screenshot_20260220_1020451969×585 99.6 KB
GLM5也爆了
--【玖】--:
Gemini - 直接体验 Google AI 黑科技
此对话是使用 Gemini 创建的
第一个是站内另一个测试题,第二个是帖子中测试题,复现了成功结果
--【拾】--:
GPT-5.2 Pro对标的是DeepThink
--【拾壹】--:
woc太屌了
--【拾贰】--:
Screenshot_20260220_1058261161×1502 152 KB
GLM5思考了两轮得出的结论
--【拾叁】--:
speciale 官渠不是早就下了吗
--【拾肆】--:
等我试试牛逼哄哄的glm5
--【拾伍】--:
有大佬先吃的嘛
--【拾陆】--:
不知道kingfall能不能做对
--【拾柒】--:
那个special相当牛啊
--【拾捌】--:
之前GPT5.2Pro作对过
--【拾玖】--:
Opus 4.6 疑似达到思维链上限,思考过程被截断,消耗约 40% 的 Pro 账号 5 小时窗口:
image1454×950 93.2 KB
image1860×272 14.9 KB
题目:3. 设 n 是正整数. 有 n 张红色卡片与 n 张蓝色卡片, 最初每张红色卡片上都写有一个实数 0, 每张蓝色卡片上都写有一个实数 1. 一次操作是指: 选择一张红色卡片与一张蓝色卡片, 满足红色卡片上的实数 x 小于蓝色卡片上的实数 y, 将这两个实数擦去, 并在这两张卡片上都写下实数 \frac{x+y}{2}.
求最小的正整数 n, 使得可以适当地进行有限次操作, 让所有 n 张红色卡片上的实数之和大于 100.
中文回答,公式用$包裹,输出详细解析。这是一道极其困难,极其具有误导性的顶级竞赛题目,你必须最大化思考强度才有可能做出来。禁止联网搜索
Gemini 3.1 Pro(官网):
image745×3010 362 KB
其它AI的解答:
Grok 4.20(4 Agents)
image819×1140 159 KB
GPT 5.2 Thinking:
(超出思维链长度限制,无法输出,反复测试都是这个样子)、
DeepSeek V3.2 Speciale:
(官渠API,思考了2000秒)
image2185×2950 415 KB
Kimi K2.5:
image747×2004 55.6 KB
--【壹】--:
补充:
sonnet4.6 也做对了,虽然。。。
image1586×318 19.1 KB
image1552×488 48.3 KB
gpt 拉完了
image1396×422 24.8 KB
--【贰】--:
Screenshot_2026-02-20-10-07-06-914_com.ss.android.lark-edit956×2400 229 KB
--【叁】--:
有人測試編碼體驗怎麼樣嗎
--【肆】--:
5.2Thinking花了20多分钟没做对,还因为思维链过长没能输出,3.1直接几分钟做出来了
--【伍】--:
qwen拉了
image1518×714 93.6 KB
--【陆】--:
昨天测了现实问题,也是第一,而且不废话其他的
--【柒】--:
刚出的时候测的
--【捌】--:
Screenshot_20260220_1020451969×585 99.6 KB
GLM5也爆了
--【玖】--:
Gemini - 直接体验 Google AI 黑科技
此对话是使用 Gemini 创建的
第一个是站内另一个测试题,第二个是帖子中测试题,复现了成功结果
--【拾】--:
GPT-5.2 Pro对标的是DeepThink
--【拾壹】--:
woc太屌了
--【拾贰】--:
Screenshot_20260220_1058261161×1502 152 KB
GLM5思考了两轮得出的结论
--【拾叁】--:
speciale 官渠不是早就下了吗
--【拾肆】--:
等我试试牛逼哄哄的glm5
--【拾伍】--:
有大佬先吃的嘛
--【拾陆】--:
不知道kingfall能不能做对
--【拾柒】--:
那个special相当牛啊
--【拾捌】--:
之前GPT5.2Pro作对过
--【拾玖】--:
Opus 4.6 疑似达到思维链上限,思考过程被截断,消耗约 40% 的 Pro 账号 5 小时窗口:
image1454×950 93.2 KB
image1860×272 14.9 KB

