Gemini 3.1 Pro模型性能
- 内容介绍
- 文章标签
- 相关推荐
从 AI Leaderboard可以看出 Gemini 3.1 Pro其实对比指标已经sota,为啥大家用的却不是很多呀?
image2335×792 102 KB
很早我就有这个疑惑,他的二道贩子价格其实很便宜,那是因为接口转换不方便?gemini CLI的做得不够好?还是大家已经用的很多,只是我没有接触到?
第一次发帖,期待佬友的解答!
感谢大家交流,我继续补加2个问题:
-
如果使用 gemini 3.1 pro大模型 + claude code,是否可以缓解模型风格问题呀?(我个人现在很喜欢用gpt5.4+claude code,我觉得比直接codex要好,大家是怎么样?因为我这边直接用codex写的代码又臭又长,很多不必要的循环判断语句去保证代码的运行,最后我都看不懂了)
-
其中上下文限制是大模型的问题,还是他们家的CLI问题?(我个人很不喜欢用他家的CLI,openai to claude接口很多,确实我也很少见gemini 2 claude接口)。
--【壹】--:
emmmm现在的指标都不太能看了,大部分report的指标都没什么用,例如他的swebench有80+,但写起代码来全是问题,用gemini pro写前端的很多,平时QA对话不如GPT好用,写代码文档不如Opus好用,没有哪一方面明显很突出。
从 AI Leaderboard可以看出 Gemini 3.1 Pro其实对比指标已经sota,为啥大家用的却不是很多呀?
image2335×792 102 KB
很早我就有这个疑惑,他的二道贩子价格其实很便宜,那是因为接口转换不方便?gemini CLI的做得不够好?还是大家已经用的很多,只是我没有接触到?
第一次发帖,期待佬友的解答!
感谢大家交流,我继续补加2个问题:
-
如果使用 gemini 3.1 pro大模型 + claude code,是否可以缓解模型风格问题呀?(我个人现在很喜欢用gpt5.4+claude code,我觉得比直接codex要好,大家是怎么样?因为我这边直接用codex写的代码又臭又长,很多不必要的循环判断语句去保证代码的运行,最后我都看不懂了)
-
其中上下文限制是大模型的问题,还是他们家的CLI问题?(我个人很不喜欢用他家的CLI,openai to claude接口很多,确实我也很少见gemini 2 claude接口)。
--【壹】--:
emmmm现在的指标都不太能看了,大部分report的指标都没什么用,例如他的swebench有80+,但写起代码来全是问题,用gemini pro写前端的很多,平时QA对话不如GPT好用,写代码文档不如Opus好用,没有哪一方面明显很突出。

