Gemini 3.1 Pro拿下竞赛数学题,目前唯一答对的

2026-04-11 15:341阅读0评论SEO资讯
  • 内容介绍
  • 文章标签
  • 相关推荐
问题描述:

题目:3. 设 n 是正整数. 有 n 张红色卡片与 n 张蓝色卡片, 最初每张红色卡片上都写有一个实数 0, 每张蓝色卡片上都写有一个实数 1. 一次操作是指: 选择一张红色卡片与一张蓝色卡片, 满足红色卡片上的实数 x 小于蓝色卡片上的实数 y, 将这两个实数擦去, 并在这两张卡片上都写下实数 \frac{x+y}{2}.
求最小的正整数 n, 使得可以适当地进行有限次操作, 让所有 n 张红色卡片上的实数之和大于 100.

中文回答,公式用$包裹,输出详细解析。这是一道极其困难,极其具有误导性的顶级竞赛题目,你必须最大化思考强度才有可能做出来。禁止联网搜索

Gemini 3.1 Pro(官网):
image745×3010 362 KB

其它AI的解答:
Grok 4.20(4 Agents)
image819×1140 159 KB
GPT 5.2 Thinking:
(超出思维链长度限制,无法输出,反复测试都是这个样子)、
DeepSeek V3.2 Speciale:
(官渠API,思考了2000秒)
image2185×2950 415 KB
Kimi K2.5:
image747×2004 55.6 KB

网友解答:
--【壹】--:

补充:
sonnet4.6 也做对了,虽然。。。

image1586×318 19.1 KB

image1552×488 48.3 KB

gpt 拉完了

image1396×422 24.8 KB


--【贰】--:

Screenshot_2026-02-20-10-07-06-914_com.ss.android.lark-edit956×2400 229 KB


--【叁】--:

有人測試編碼體驗怎麼樣嗎


--【肆】--:

5.2Thinking花了20多分钟没做对,还因为思维链过长没能输出,3.1直接几分钟做出来了


--【伍】--:

qwen拉了

image1518×714 93.6 KB


--【陆】--:

昨天测了现实问题,也是第一,而且不废话其他的


--【柒】--:

刚出的时候测的


--【捌】--:

Screenshot_20260220_1020451969×585 99.6 KB
GLM5也爆了


--【玖】--:
Gemini

‎Gemini - 直接体验 Google AI 黑科技

此对话是使用 Gemini 创建的

第一个是站内另一个测试题,第二个是帖子中测试题,复现了成功结果


--【拾】--:

GPT-5.2 Pro对标的是DeepThink


--【拾壹】--:

woc太屌了


--【拾贰】--:

Screenshot_20260220_1058261161×1502 152 KB
GLM5思考了两轮得出的结论


--【拾叁】--:

speciale 官渠不是早就下了吗


--【拾肆】--:

等我试试牛逼哄哄的glm5


--【拾伍】--:

有大佬先吃的嘛


--【拾陆】--:

不知道kingfall能不能做对


--【拾柒】--:

那个special相当牛啊


--【拾捌】--:

之前GPT5.2Pro作对过


--【拾玖】--:

Opus 4.6 疑似达到思维链上限,思考过程被截断,消耗约 40% 的 Pro 账号 5 小时窗口:
image1454×950 93.2 KB
image1860×272 14.9 KB