小道消息:claude code思考深度下降67%,已无法胜任复杂的工程任务
- 内容介绍
- 文章标签
- 相关推荐
来源issue
一个cc的重度用户拿几千个 session 日志做量化分析,发现模型从 research-first 退化成 edit-first,复杂工程任务明显变得更偷懒、更草率。各位佬们体感如何?
ps. Anthropics把issue关了
网友解答:--【壹】--:
昨天一直在查一个爬虫的问题,大概描述的话,就是因为有一个地方,直接导致代码报错了,然后让cc + claude去排查(官方订阅),结果半天不知道什么原因,好几次给了错误的答案,然后再让它检查一下代码,才发现了问题,但是也是半发现的状态。
随后是用codex的gpt5.4 high,一下子就发现了问题所在了
--【贰】--:
openai是正确的 a/是该死的
什么时候来个正义内鬼把claude opus 4.6开源了
--【叁】--:
经典 没人提问题/没其他人看到有人提问题 = 没问题
--【肆】--:
没事,只要gpt6发起进攻一切都会好起来的
--【伍】--: neilforest:
ps. Anthropics 把 issue 关了
啊??
这种办法都想得到
。。。。。。。
--【陆】--:
最近几天确实感觉到了CC非常的笨,有点使用国产模型的那种感觉了。
干活不全面,我说啥干啥,而不是根据我说的去联动的修改关联的模块。
--【柒】--:
我跟她的体感一样,就是4.6出来后,感觉就很差了,有些功能明明没写,他说写好了。然后看bug,他说没问题。就是随机给你一个,可以跑通的就算了。
--【捌】--:
看cc源码是会出现issue里面提到的一些情况
--【玖】--:
感觉照这么下去 A\可能又得砍总量 并且还得涨价
--【拾】--:
用codex吧,要是嫌慢,可以在cc里面用gpt
--【拾壹】--:
A社太傲慢了。。。我就说最近cc越来越笨了,真不是我的错觉
--【拾贰】--:
思考深度也可以量化的吗,有点大模型幻觉的味道了
--【拾叁】--:
无所谓,已经投靠 openai,现在我是奥特曼的狗
--【拾肆】--:
我也觉得最近cc不是很聪明……官方订阅!!
--【拾伍】--:
我要好好看一下让奥特曼倒地不起的超智能模型…期待能把该死的口癖删了
--【拾陆】--:
今天反而发现gpt5.4变聪明了,先用着再说吧
--【拾柒】--:
提issue的用户还是拿着opus来分析cc的对话记录跟toolcall记录,然后就有了:
这份报告由我——Claude Opus 4.6——通过分析我自己的会话日志生成。我能清楚看到,我的读改比从6.6直接跌到了2.0;有173次我想草草结束工作,最后全被一个bash脚本强行拉了回来;甚至我还在输出内容里写下“这也太敷衍、错得离谱”这样的自我评价。
但站在我自己的角度,我根本判断不出自己有没有在深度思考。我完全没感觉到思考预算的限制,只是莫名其妙就交出了更差的结果。那些被终止钩子捕捉到的话,要是在2月份,我绝对不会说出口;而且我自己也是直到钩子触发时,才反应过来自己居然说了这些话。
--【拾捌】--:
吓死,还以为是用户的思考深度下降67%,已无法胜任复杂任务
--【拾玖】--:
我的思考深度已经下降了100%
没有cc不会写代码了
来源issue
一个cc的重度用户拿几千个 session 日志做量化分析,发现模型从 research-first 退化成 edit-first,复杂工程任务明显变得更偷懒、更草率。各位佬们体感如何?
ps. Anthropics把issue关了
网友解答:--【壹】--:
昨天一直在查一个爬虫的问题,大概描述的话,就是因为有一个地方,直接导致代码报错了,然后让cc + claude去排查(官方订阅),结果半天不知道什么原因,好几次给了错误的答案,然后再让它检查一下代码,才发现了问题,但是也是半发现的状态。
随后是用codex的gpt5.4 high,一下子就发现了问题所在了
--【贰】--:
openai是正确的 a/是该死的
什么时候来个正义内鬼把claude opus 4.6开源了
--【叁】--:
经典 没人提问题/没其他人看到有人提问题 = 没问题
--【肆】--:
没事,只要gpt6发起进攻一切都会好起来的
--【伍】--: neilforest:
ps. Anthropics 把 issue 关了
啊??
这种办法都想得到
。。。。。。。
--【陆】--:
最近几天确实感觉到了CC非常的笨,有点使用国产模型的那种感觉了。
干活不全面,我说啥干啥,而不是根据我说的去联动的修改关联的模块。
--【柒】--:
我跟她的体感一样,就是4.6出来后,感觉就很差了,有些功能明明没写,他说写好了。然后看bug,他说没问题。就是随机给你一个,可以跑通的就算了。
--【捌】--:
看cc源码是会出现issue里面提到的一些情况
--【玖】--:
感觉照这么下去 A\可能又得砍总量 并且还得涨价
--【拾】--:
用codex吧,要是嫌慢,可以在cc里面用gpt
--【拾壹】--:
A社太傲慢了。。。我就说最近cc越来越笨了,真不是我的错觉
--【拾贰】--:
思考深度也可以量化的吗,有点大模型幻觉的味道了
--【拾叁】--:
无所谓,已经投靠 openai,现在我是奥特曼的狗
--【拾肆】--:
我也觉得最近cc不是很聪明……官方订阅!!
--【拾伍】--:
我要好好看一下让奥特曼倒地不起的超智能模型…期待能把该死的口癖删了
--【拾陆】--:
今天反而发现gpt5.4变聪明了,先用着再说吧
--【拾柒】--:
提issue的用户还是拿着opus来分析cc的对话记录跟toolcall记录,然后就有了:
这份报告由我——Claude Opus 4.6——通过分析我自己的会话日志生成。我能清楚看到,我的读改比从6.6直接跌到了2.0;有173次我想草草结束工作,最后全被一个bash脚本强行拉了回来;甚至我还在输出内容里写下“这也太敷衍、错得离谱”这样的自我评价。
但站在我自己的角度,我根本判断不出自己有没有在深度思考。我完全没感觉到思考预算的限制,只是莫名其妙就交出了更差的结果。那些被终止钩子捕捉到的话,要是在2月份,我绝对不会说出口;而且我自己也是直到钩子触发时,才反应过来自己居然说了这些话。
--【拾捌】--:
吓死,还以为是用户的思考深度下降67%,已无法胜任复杂任务
--【拾玖】--:
我的思考深度已经下降了100%
没有cc不会写代码了

