Gemini 3.1 Pro模型性能

2026-04-29 10:372阅读0评论SEO基础

内容介绍
文章标签
相关推荐

问题描述：

从 AI Leaderboard可以看出 Gemini 3.1 Pro其实对比指标已经sota，为啥大家用的却不是很多呀？
image2335×792 102 KB

很早我就有这个疑惑，他的二道贩子价格其实很便宜，那是因为接口转换不方便？gemini CLI的做得不够好？还是大家已经用的很多，只是我没有接触到？

第一次发帖，期待佬友的解答！

感谢大家交流，我继续补加2个问题：

如果使用 gemini 3.1 pro大模型 + claude code，是否可以缓解模型风格问题呀？（我个人现在很喜欢用gpt5.4+claude code，我觉得比直接codex要好，大家是怎么样？因为我这边直接用codex写的代码又臭又长，很多不必要的循环判断语句去保证代码的运行，最后我都看不懂了）
其中上下文限制是大模型的问题，还是他们家的CLI问题？（我个人很不喜欢用他家的CLI，openai to claude接口很多，确实我也很少见gemini 2 claude接口）。

网友解答：

--【壹】--：

emmmm现在的指标都不太能看了，大部分report的指标都没什么用，例如他的swebench有80+，但写起代码来全是问题，用gemini pro写前端的很多，平时QA对话不如GPT好用，写代码文档不如Opus好用，没有哪一方面明显很突出。更重要的是，gemini-cli真的很很很很很差很难用，现在稍微好一点，但之前刚release pro的时候是真的差

--【贰】--：

似乎是因为上下文的原因一长直接变成弱智

--【叁】--：

写论文查资料用用还可以，写代码能力是真的不行

--【肆】--：

简单来说，Gemini 3.1 Pro：光鲜的外表（大世界知识、（对一些问题）好回答风格、刷的巨高的分）下藏着难以忍受的缺陷（上下文稍微长点爆性能、弱 Agent 能力、C端普遍降智、文档差）

但是你就用世界知识和回答风格那就很爽

--【伍】--：

cli我不知道。
但是在使用gpt claude gemini三家网页版的过程中，我发现gemini确实是最差的，不提现在的普遍降智了，以前也没有多好，尤其是写代码的能力很差，让他改不知道改出了个什么东西，感觉不太听人话，上下文也很烂

--【陆】--：

我试过反重力和gemini cli 下的gemini 3.1pro，改稍微复杂点的代码就跟国模一样反复出错，而且上下文注意力很差，还经常把以前的内容当我这次的指令。写论文方面又很喜欢说大话。

--【柒】--：

哈吉米配啊…能力真的不行，这个榜单是打出来的

--【捌】--：

我一般是让GPT写完代码后，让gemini把GPT写的一坨前端部分重构一下

--【玖】--：

最让人作呕的就是他的回答风格，你给他一坨他也会夸你写得好，很难受啊

--【拾】--：

很简单，这是纯粹的野榜，毫无参考价值，你实战一下就知道了，效果跟国产模型坐一桌，除了前端，其他一无是处

--【拾壹】--：

一段时间没用过Gemini了，听到对他的讨论都是哀声怨道，自然而然就没兴趣

--【拾贰】--：

现在的gemini 3.1感觉前端能力也是一坨，

--【拾叁】--：

啊哈哈哈，网页端我经常遇见这种问题，他甚至会说我的问题是“神来之笔”。

--【拾肆】--：

天天用库库用已经变成 Gemini 的形状了

--【拾伍】--：

429速率限制，403软封禁，超级大降智，朝令夕改的会员政策，超低的注意力超强的逆反心理。选一个你喜欢的吧。

--【拾陆】--：

实际体验下来不同家的表现还是有很大差距吧，虽然智商可能差不多。不够Gemini在长上下文确实不错

标签：Gemini 人工智能