Gemini 3.1 Pro模型性能
- 内容介绍
- 文章标签
- 相关推荐
从 AI Leaderboard可以看出 Gemini 3.1 Pro其实对比指标已经sota,为啥大家用的却不是很多呀?
image2335×792 102 KB
很早我就有这个疑惑,他的二道贩子价格其实很便宜,那是因为接口转换不方便?gemini CLI的做得不够好?还是大家已经用的很多,只是我没有接触到?
第一次发帖,期待佬友的解答!
感谢大家交流,我继续补加2个问题:
-
如果使用 gemini 3.1 pro大模型 + claude code,是否可以缓解模型风格问题呀?(我个人现在很喜欢用gpt5.4+claude code,我觉得比直接codex要好,大家是怎么样?因为我这边直接用codex写的代码又臭又长,很多不必要的循环判断语句去保证代码的运行,最后我都看不懂了)
-
其中上下文限制是大模型的问题,还是他们家的CLI问题?(我个人很不喜欢用他家的CLI,openai to claude接口很多,确实我也很少见gemini 2 claude接口)。
--【壹】--:
emmmm现在的指标都不太能看了,大部分report的指标都没什么用,例如他的swebench有80+,但写起代码来全是问题,用gemini pro写前端的很多,平时QA对话不如GPT好用,写代码文档不如Opus好用,没有哪一方面明显很突出。更重要的是,gemini-cli真的很很很很很差很难用,现在稍微好一点,但之前刚release pro的时候是真的差
--【贰】--:
似乎是因为上下文的原因 一长直接变成弱智
--【叁】--:
写论文查资料用用还可以,写代码能力是真的不行
--【肆】--:
简单来说,Gemini 3.1 Pro:光鲜的外表(大世界知识、(对一些问题)好回答风格、刷的巨高的分)下藏着难以忍受的缺陷(上下文稍微长点爆性能、弱 Agent 能力、C端普遍降智、文档差)
但是你就用世界知识和回答风格那就很爽
--【伍】--:
cli我不知道。
但是在使用gpt claude gemini三家网页版的过程中,我发现gemini确实是最差的,不提现在的普遍降智了,以前也没有多好,尤其是写代码的能力很差,让他改不知道改出了个什么东西,感觉不太听人话,上下文也很烂
--【陆】--:
我试过反重力和gemini cli 下的gemini 3.1pro,改稍微复杂点的代码就跟国模一样反复出错,而且上下文注意力很差,还经常把以前的内容当我这次的指令。写论文方面又很喜欢说大话。
--【柒】--:
哈吉米配啊…能力真的不行,这个榜单是打出来的
--【捌】--:
我一般是让GPT写完代码后,让gemini把GPT写的一坨前端部分重构一下
--【玖】--:
最让人作呕的就是他的回答风格,你给他一坨他也会夸你写得好,很难受啊
--【拾】--:
很简单,这是纯粹的野榜,毫无参考价值,你实战一下就知道了,效果跟国产模型坐一桌,除了前端,其他一无是处
--【拾壹】--:
一段时间没用过Gemini了,听到对他的讨论都是哀声怨道,自然而然就没兴趣
--【拾贰】--:
现在的gemini 3.1感觉前端能力也是一坨,
--【拾叁】--:
啊哈哈哈,网页端我经常遇见这种问题,他甚至会说我的问题是“神来之笔”。
--【拾肆】--:
天天用 库库用 已经变成 Gemini 的形状了
--【拾伍】--:
429速率限制,403软封禁,超级大降智,朝令夕改的会员政策,超低的注意力超强的逆反心理。选一个你喜欢的吧。
--【拾陆】--:
实际体验下来不同家的表现还是有很大差距吧,虽然智商可能差不多。不够Gemini在长上下文确实不错
从 AI Leaderboard可以看出 Gemini 3.1 Pro其实对比指标已经sota,为啥大家用的却不是很多呀?
image2335×792 102 KB
很早我就有这个疑惑,他的二道贩子价格其实很便宜,那是因为接口转换不方便?gemini CLI的做得不够好?还是大家已经用的很多,只是我没有接触到?
第一次发帖,期待佬友的解答!
感谢大家交流,我继续补加2个问题:
-
如果使用 gemini 3.1 pro大模型 + claude code,是否可以缓解模型风格问题呀?(我个人现在很喜欢用gpt5.4+claude code,我觉得比直接codex要好,大家是怎么样?因为我这边直接用codex写的代码又臭又长,很多不必要的循环判断语句去保证代码的运行,最后我都看不懂了)
-
其中上下文限制是大模型的问题,还是他们家的CLI问题?(我个人很不喜欢用他家的CLI,openai to claude接口很多,确实我也很少见gemini 2 claude接口)。
--【壹】--:
emmmm现在的指标都不太能看了,大部分report的指标都没什么用,例如他的swebench有80+,但写起代码来全是问题,用gemini pro写前端的很多,平时QA对话不如GPT好用,写代码文档不如Opus好用,没有哪一方面明显很突出。更重要的是,gemini-cli真的很很很很很差很难用,现在稍微好一点,但之前刚release pro的时候是真的差
--【贰】--:
似乎是因为上下文的原因 一长直接变成弱智
--【叁】--:
写论文查资料用用还可以,写代码能力是真的不行
--【肆】--:
简单来说,Gemini 3.1 Pro:光鲜的外表(大世界知识、(对一些问题)好回答风格、刷的巨高的分)下藏着难以忍受的缺陷(上下文稍微长点爆性能、弱 Agent 能力、C端普遍降智、文档差)
但是你就用世界知识和回答风格那就很爽
--【伍】--:
cli我不知道。
但是在使用gpt claude gemini三家网页版的过程中,我发现gemini确实是最差的,不提现在的普遍降智了,以前也没有多好,尤其是写代码的能力很差,让他改不知道改出了个什么东西,感觉不太听人话,上下文也很烂
--【陆】--:
我试过反重力和gemini cli 下的gemini 3.1pro,改稍微复杂点的代码就跟国模一样反复出错,而且上下文注意力很差,还经常把以前的内容当我这次的指令。写论文方面又很喜欢说大话。
--【柒】--:
哈吉米配啊…能力真的不行,这个榜单是打出来的
--【捌】--:
我一般是让GPT写完代码后,让gemini把GPT写的一坨前端部分重构一下
--【玖】--:
最让人作呕的就是他的回答风格,你给他一坨他也会夸你写得好,很难受啊
--【拾】--:
很简单,这是纯粹的野榜,毫无参考价值,你实战一下就知道了,效果跟国产模型坐一桌,除了前端,其他一无是处
--【拾壹】--:
一段时间没用过Gemini了,听到对他的讨论都是哀声怨道,自然而然就没兴趣
--【拾贰】--:
现在的gemini 3.1感觉前端能力也是一坨,
--【拾叁】--:
啊哈哈哈,网页端我经常遇见这种问题,他甚至会说我的问题是“神来之笔”。
--【拾肆】--:
天天用 库库用 已经变成 Gemini 的形状了
--【拾伍】--:
429速率限制,403软封禁,超级大降智,朝令夕改的会员政策,超低的注意力超强的逆反心理。选一个你喜欢的吧。
--【拾陆】--:
实际体验下来不同家的表现还是有很大差距吧,虽然智商可能差不多。不够Gemini在长上下文确实不错

