吐槽下GPT 的前额叶切除手术
- 内容介绍
- 文章标签
- 相关推荐
不知道为啥,现在的 GPT 怎么就感觉明明很聪明,但是就是不说人话,原来 gpt-4O 的时候,不考虑代码能力,至少用户交互体验这方面做的很好。从 O1 开始模型就开始变得聪明,但是不讲人话了
同时,我真的很好奇 GPT 的安全对齐团队真的有在做事吗?或者说,这个安全对齐的使命是什么?似乎在伊利亚之前的安全对齐团队做出的安全对齐策略不是像这样简单的前额叶切除手术,现在随便一个问题就是——“出于安全问题考量,我没有办法回答你的问题”我真的晕了。
现在的输出直接变成了样板戏和八股文,暂且不吐槽人机恋的"我在这里哪也不去,就这么接住你",现在就算是生产力问题,或者是普通知识的问答还有解决基本问题都变成了"不是…而是…"“先给你一个基本的结论”“现在我给你一个最小实现方案”,gpt 的产品经理到底脑子里面装的是啥?中文语料是污染到什么程度了,才会出现这么离谱的输出?(Codex系列模型里面出现澳门人广告就更别提了)
其次还有就是这个分段问题,我去,为啥你就不能好好整理成一段,输出一个知识点或者是一个简单问题,每次那个回车键都是不要钱的使劲敲,咋滴,多一个回车键奥特曼就越家庭美满幸福呗?
OpenAI 是真的应该反思为什么自己明明领跑,最后自己的基模交互做的那么垃圾(没有说其他厂商好的意思),用户可以可以为了你的溢价付费,但是前提是体验足够好,你可以是提供情绪价值牛逼,或者是生产力牛逼。但是至少不应该是每个哪里都不占,却什么都想要,最后什么都做不好,包括但不限于死掉的 Sora2,一直在传的成人 18+模式,codex 慢到极致的速度(但是站内公益站能白嫖,就不骂你了),输出极致糟糕的 web 端模型。你抄 Claude 总该会吧?我去改掉你这个nc 不说人话的毛病真的很难吗?
还有这个奥特曼,你什么时候才能不吹牛,gpt5 出来的时候,说天下第一牛逼,我去,真信了你的鬼话,框框往里充了 12 个月的会员,最后呢?我去。。。
最后,我想说,请国模加油,我只是一名普通用户,我只用体验感来投票,如果有更好使用 gpt 的方法欢迎分享!
注:这是本人体验完 claude-4.6-sonnet 后用回 gpt5.4-thinking 模式后的破防小瞬间。4O 你快回来吧,虽然你蠢,但你用的顺手啊。。。我去
--【壹】--:
就是让opus规划codex干活吧,然后opus再验收
--【贰】--:
是的,感觉已经降智到无法使用 地步了
--【叁】--:
个人体验,gpt的准确率非常高,吊打gemini了,但是确实不说人话
--【肆】--:
opus 爽用吗?哈哈哈,佬那你很富有了
--【伍】--:
个人感觉opus唯一的优势就是它的文风非常好。
趁现在Claude爽用多琢磨如何消耗
--【陆】--:
之前有人发过调教gpt说人话的提示词,佬友可以试试
--【柒】--:
个人觉得 Opus 的输出已经很不错了。。。将就着用吧
--【捌】--: Chiney:
4O 你快回来吧,虽然你蠢,但你用的顺手啊。。。我去
是啊,为什么不同时保留会说人话的4o,很难理解他们脑回路
--【玖】--:
GTP 很多句子表态文字很奇怪,怎么说呢,有些句子看起来比较费劲,写出的内容要其他 AI 润色才能很好读懂。从某种方面说,继续朝这个方面努力,中文用户就会少很多,也不用考虑封杀注册机什么的了。
--【拾】--:
因为太拟人会被某些脑子有问题的家伙当恋人用
然后就是所谓的安全
--【拾壹】--:
和你同样的问题,已经无法和 gpt 正常对话交流了,废话多而且不说人话,特别喜欢换行,换了 claude 感觉舒服多了,目前 chatgpt 只 thinking 用来进行搜索信息和写代码了
--【拾贰】--:
算了能干活就行
聊天找别的
--【拾叁】--:
代码端我记得是有的
--【拾肆】--:
有没有人做一个让gpt 5.4先回答,然后自动让opus 4.6润色的工具?
--【拾伍】--:
同样感受,上个星期用gpt5.4玩龙虾的时候也发了个帖子吐槽。
有些时候文风也会影响输出质量的,输出本就是给人看的,人看不进去的话内容再正确也没用
--【拾陆】--:
其实GPT5系列什么都懂,也很聪明.
但是它有表达障碍。
意思是,他会在一大堆话里绕来绕去,反复讲过程。
把结论藏在某一句话里——他说了十句,只有一句是结论,其余都在讲废话,绕来绕去。
如果你只抓住这一句结论,会觉得他很聪明,找到了重点;但如果你看完整段,就会觉得这傻逼里吧嗦到底在说啥。
我根据我的推理: 是因为他在输出时有最低字数限制,导致它必须凑满字,没内容就硬凑,才出现了反复绕来绕去这个问题。
像 Claude 就不会,Claude 如果真的没话,只会回答你两个字:是的。
而 GPT 一定会凑满五百到一千个字,才算回复到位。
--【拾柒】--:
害 hh,佬你也说的对,但是我平时代码用的少,今天和他交互真的破防了
--【拾捌】--:
不是降智,模型训练不注重对话方面的表现了,一心想搞 coding
--【拾玖】--:
是的,害,最后的结果就是,普通用户也要承受前额叶切除手术之痛
不知道为啥,现在的 GPT 怎么就感觉明明很聪明,但是就是不说人话,原来 gpt-4O 的时候,不考虑代码能力,至少用户交互体验这方面做的很好。从 O1 开始模型就开始变得聪明,但是不讲人话了
同时,我真的很好奇 GPT 的安全对齐团队真的有在做事吗?或者说,这个安全对齐的使命是什么?似乎在伊利亚之前的安全对齐团队做出的安全对齐策略不是像这样简单的前额叶切除手术,现在随便一个问题就是——“出于安全问题考量,我没有办法回答你的问题”我真的晕了。
现在的输出直接变成了样板戏和八股文,暂且不吐槽人机恋的"我在这里哪也不去,就这么接住你",现在就算是生产力问题,或者是普通知识的问答还有解决基本问题都变成了"不是…而是…"“先给你一个基本的结论”“现在我给你一个最小实现方案”,gpt 的产品经理到底脑子里面装的是啥?中文语料是污染到什么程度了,才会出现这么离谱的输出?(Codex系列模型里面出现澳门人广告就更别提了)
其次还有就是这个分段问题,我去,为啥你就不能好好整理成一段,输出一个知识点或者是一个简单问题,每次那个回车键都是不要钱的使劲敲,咋滴,多一个回车键奥特曼就越家庭美满幸福呗?
OpenAI 是真的应该反思为什么自己明明领跑,最后自己的基模交互做的那么垃圾(没有说其他厂商好的意思),用户可以可以为了你的溢价付费,但是前提是体验足够好,你可以是提供情绪价值牛逼,或者是生产力牛逼。但是至少不应该是每个哪里都不占,却什么都想要,最后什么都做不好,包括但不限于死掉的 Sora2,一直在传的成人 18+模式,codex 慢到极致的速度(但是站内公益站能白嫖,就不骂你了),输出极致糟糕的 web 端模型。你抄 Claude 总该会吧?我去改掉你这个nc 不说人话的毛病真的很难吗?
还有这个奥特曼,你什么时候才能不吹牛,gpt5 出来的时候,说天下第一牛逼,我去,真信了你的鬼话,框框往里充了 12 个月的会员,最后呢?我去。。。
最后,我想说,请国模加油,我只是一名普通用户,我只用体验感来投票,如果有更好使用 gpt 的方法欢迎分享!
注:这是本人体验完 claude-4.6-sonnet 后用回 gpt5.4-thinking 模式后的破防小瞬间。4O 你快回来吧,虽然你蠢,但你用的顺手啊。。。我去
--【壹】--:
就是让opus规划codex干活吧,然后opus再验收
--【贰】--:
是的,感觉已经降智到无法使用 地步了
--【叁】--:
个人体验,gpt的准确率非常高,吊打gemini了,但是确实不说人话
--【肆】--:
opus 爽用吗?哈哈哈,佬那你很富有了
--【伍】--:
个人感觉opus唯一的优势就是它的文风非常好。
趁现在Claude爽用多琢磨如何消耗
--【陆】--:
之前有人发过调教gpt说人话的提示词,佬友可以试试
--【柒】--:
个人觉得 Opus 的输出已经很不错了。。。将就着用吧
--【捌】--: Chiney:
4O 你快回来吧,虽然你蠢,但你用的顺手啊。。。我去
是啊,为什么不同时保留会说人话的4o,很难理解他们脑回路
--【玖】--:
GTP 很多句子表态文字很奇怪,怎么说呢,有些句子看起来比较费劲,写出的内容要其他 AI 润色才能很好读懂。从某种方面说,继续朝这个方面努力,中文用户就会少很多,也不用考虑封杀注册机什么的了。
--【拾】--:
因为太拟人会被某些脑子有问题的家伙当恋人用
然后就是所谓的安全
--【拾壹】--:
和你同样的问题,已经无法和 gpt 正常对话交流了,废话多而且不说人话,特别喜欢换行,换了 claude 感觉舒服多了,目前 chatgpt 只 thinking 用来进行搜索信息和写代码了
--【拾贰】--:
算了能干活就行
聊天找别的
--【拾叁】--:
代码端我记得是有的
--【拾肆】--:
有没有人做一个让gpt 5.4先回答,然后自动让opus 4.6润色的工具?
--【拾伍】--:
同样感受,上个星期用gpt5.4玩龙虾的时候也发了个帖子吐槽。
有些时候文风也会影响输出质量的,输出本就是给人看的,人看不进去的话内容再正确也没用
--【拾陆】--:
其实GPT5系列什么都懂,也很聪明.
但是它有表达障碍。
意思是,他会在一大堆话里绕来绕去,反复讲过程。
把结论藏在某一句话里——他说了十句,只有一句是结论,其余都在讲废话,绕来绕去。
如果你只抓住这一句结论,会觉得他很聪明,找到了重点;但如果你看完整段,就会觉得这傻逼里吧嗦到底在说啥。
我根据我的推理: 是因为他在输出时有最低字数限制,导致它必须凑满字,没内容就硬凑,才出现了反复绕来绕去这个问题。
像 Claude 就不会,Claude 如果真的没话,只会回答你两个字:是的。
而 GPT 一定会凑满五百到一千个字,才算回复到位。
--【拾柒】--:
害 hh,佬你也说的对,但是我平时代码用的少,今天和他交互真的破防了
--【拾捌】--:
不是降智,模型训练不注重对话方面的表现了,一心想搞 coding
--【拾玖】--:
是的,害,最后的结果就是,普通用户也要承受前额叶切除手术之痛

