驴栓问题的ai测试
- 内容介绍
- 文章标签
- 相关推荐
8638d832409a2fab2fa88787596be22b411×401 72.5 KB
我尝试了Gemini的各类模型,都没给出正确答案:
image747×618 53.2 KB
下面是别人测试的结果:
f52ee0612571df0db37111b8ad52eede749×816 85.6 KB
这种考验的是模型的什么能力?应该不但读图吧
网友解答:--【壹】--:
seed2的pro lite都没问题,k2.5不咋行,qwen3.5plus虽然对了但是整整思考了428秒最佳思考王.jpg
image2220×1362 156 KB
image2222×1292 150 KB
image2216×1236 127 KB
image2212×1332 172 KB
image2226×1322 265 KB
--【贰】--:
前面解题思路都挺详细的,这不会是临时干预了强制加权的结果吧
--【叁】--:
image1672×1686 196 KB
image1210×1106 179 KB
是不是已经更新了,豆包和gemini都对了。
--【肆】--:
不知道,说不准是精准优化了?gemini就只有这点内容,看起来没怎么思考但时间花了不少,豆包倒是是思考了一大堆还花了不少时间,主要是太长了我懒得截长图。
--【伍】--:
93115bb7f6048b83740866a864f32c7a1338×1025 61.7 KB
豆包也瞎回答了
--【陆】--:
比较考验读图跟推理能力的结合了
8638d832409a2fab2fa88787596be22b411×401 72.5 KB
我尝试了Gemini的各类模型,都没给出正确答案:
image747×618 53.2 KB
下面是别人测试的结果:
f52ee0612571df0db37111b8ad52eede749×816 85.6 KB
这种考验的是模型的什么能力?应该不但读图吧
网友解答:--【壹】--:
seed2的pro lite都没问题,k2.5不咋行,qwen3.5plus虽然对了但是整整思考了428秒最佳思考王.jpg
image2220×1362 156 KB
image2222×1292 150 KB
image2216×1236 127 KB
image2212×1332 172 KB
image2226×1322 265 KB
--【贰】--:
前面解题思路都挺详细的,这不会是临时干预了强制加权的结果吧
--【叁】--:
image1672×1686 196 KB
image1210×1106 179 KB
是不是已经更新了,豆包和gemini都对了。
--【肆】--:
不知道,说不准是精准优化了?gemini就只有这点内容,看起来没怎么思考但时间花了不少,豆包倒是是思考了一大堆还花了不少时间,主要是太长了我懒得截长图。
--【伍】--:
93115bb7f6048b83740866a864f32c7a1338×1025 61.7 KB
豆包也瞎回答了
--【陆】--:
比较考验读图跟推理能力的结合了

