为 Gemini 正名
- 内容介绍
- 文章标签
- 相关推荐
从你还在用Gemini吗?继续讨论:
其实白墨在日常对话里,一直都是悄悄偏爱 Gemini 的
只要放下让它写代码的执念,Gemini 解释问题时那种如沐春风的耐心、舒服流畅的语感、丰富的知识储备,以及让人安心的低幻觉率,真的是很多 LLM 学不来的!
我们来看看几组对比
alt text1520×1958 290 KB
alt text1640×1931 423 KB
完全相同的 prompt,
GPT 给出的答案是事实性错误或不完全正确的
即使强制开启 Thinking,也只会象征性的“Thought for a couple of seconds”,然后依旧给出错误的答案。这种解决看似简单问题时的“轻敌”是 GPT 的一大问题。和洗车是走路去还是开车去的经典问题一样,以 GPT 的智商不可能推理不出来。然而,面对这样的问题,即便我们手动开启 Thinking 模式,GPT 也总是表现出“不愿思考”的懒惰。这在提问本身具有误导性时尤为明显。又比如:
alt text1530×1958 251 KB
alt text1640×1965 416 KB
两者回答都事实上是正确的,
但是,Gemini 极其敏锐地捕捉到了我在提问里暴露出的一个知识盲区“金属氧化物大多数都是分子”。比起单纯解答 MgO 这个个例,它更愿意耐心地帮我纠正对“大多数金属化合物”的底层认知误区。而 GPT 呢,就像个没有感情的答题机器,对提问者潜在的误解完全视而不见。
alt text1640×1962 342 KB
alt text1640×2244 404 KB
“OpenOmniBot 所谓‘直接操控手机’,主链路不是靠云端远程控制,也不是我目前看到的 ADB 脚本主导……”
我的天,谁问你了?真是看得一股无名火。黑话越读越别扭。一个好的科普,第一句话难道不应该就让人恍然大悟吗?GPT 自始至终甚至也没有解释无障碍服务能够代表用户在屏幕上执行物理操作,只有冗长的函数名的罗列。
从你还在用Gemini吗?继续讨论:
其实白墨在日常对话里,一直都是悄悄偏爱 Gemini 的
只要放下让它写代码的执念,Gemini 解释问题时那种如沐春风的耐心、舒服流畅的语感、丰富的知识储备,以及让人安心的低幻觉率,真的是很多 LLM 学不来的!
我们来看看几组对比
alt text1520×1958 290 KB
alt text1640×1931 423 KB
完全相同的 prompt,
GPT 给出的答案是事实性错误或不完全正确的
即使强制开启 Thinking,也只会象征性的“Thought for a couple of seconds”,然后依旧给出错误的答案。这种解决看似简单问题时的“轻敌”是 GPT 的一大问题。和洗车是走路去还是开车去的经典问题一样,以 GPT 的智商不可能推理不出来。然而,面对这样的问题,即便我们手动开启 Thinking 模式,GPT 也总是表现出“不愿思考”的懒惰。这在提问本身具有误导性时尤为明显。又比如:
alt text1530×1958 251 KB
alt text1640×1965 416 KB
两者回答都事实上是正确的,
但是,Gemini 极其敏锐地捕捉到了我在提问里暴露出的一个知识盲区“金属氧化物大多数都是分子”。比起单纯解答 MgO 这个个例,它更愿意耐心地帮我纠正对“大多数金属化合物”的底层认知误区。而 GPT 呢,就像个没有感情的答题机器,对提问者潜在的误解完全视而不见。
alt text1640×1962 342 KB
alt text1640×2244 404 KB
“OpenOmniBot 所谓‘直接操控手机’,主链路不是靠云端远程控制,也不是我目前看到的 ADB 脚本主导……”
我的天,谁问你了?真是看得一股无名火。黑话越读越别扭。一个好的科普,第一句话难道不应该就让人恍然大悟吗?GPT 自始至终甚至也没有解释无障碍服务能够代表用户在屏幕上执行物理操作,只有冗长的函数名的罗列。

