Claude OPUS4.6 MAX强度思考从3天前开始降智,一天不如一天,今天最明显
- 内容介绍
- 文章标签
- 相关推荐
image943×252 15.8 KB
image995×554 30 KB
20X账号,不存在任何掺水的可能性,直接是官方订阅登录的
原本的感受是,我说3,它能做10,但是这几天开始变成,我说,3,他只能做2或者1
原本的发散性和兜底全部没有了
除了人的直接感受之外,我的项目也能够证明,solodawn开发完了,再录效果视频,就在最后的攻坚,昨天,第一个测试任务跑完,评分是83,今天一模一样的任务跑完,评分是62
(solodawn这个项目的作用是 AI 全自动的开发,所以我给他定了测试任务和评分标准,在发布之前,是一遍又一遍的去跑这些测试任务。当然,跑之前肯定全部清空,不会复用之前的数据)
昨天0个TS错误,今天麽
image1223×1100 143 KB
这个模型能力降的也太多了,昨天是零个,今天直接跑测试的时候是72个,然后我感觉是不是我的整体架构有问题,所以去修,修完架构统一,错误更多,因为在修之前
image832×142 22.3 KB
修之后不存在这个问题了,错误更多,这进一步证明就是模型的问题,这跟架构已经没关系了,我也是没招儿了
佬们感受到降智了没,而且正常来讲,如果你是官方,你应该都降智了 我是官方20X 的订阅呀
image1116×218 63.6 KB
A你又干畜生事儿!
一边发帖,一边又出来这种问题,新增批量模式,它居然少功能,在原本根本不会出现这种情况啊
清空数据都做不好了!!!这都能漏东西,都得清两次,清理、完成、重启这种事情,模型都不会了吗?
image1140×626 86.7 KB
你*****
4月8日21点52分最新更新,换成 GLM5.1了,整个计划直接全部重跑,opus4.6彻底变为不可用状态,太弱智了,而且我能明显的感觉到,从3天前开始,一天比一天弱智,一天比一天弱智。现在,他终于弱智到了,我要,换回 GLM 了 6
image1937×694 241 KB
--【壹】--:
正好15号过期了,到时候考虑续不续费吧,我记得16号是吧?OpenAI 要发新模型,不行我就换
--【贰】--:
你可能被opus的所谓讨好型输出忽悠了。
在大型重构任务或者是一团混乱的局面下,只有gpt5.4才能力挽狂澜,opus4.6出场的话就是修两个bug造两个bug,无限循环下去,甚至连gpt5.1都不如。
--【叁】--:
用AI就是这样,没有一直保存第一,遇到算力不足降智、被其他模式超越情况
--【肆】--:
我这三四天用中转也是这样感觉,我都怀疑是中转参水,原来不是错觉。
--【伍】--:
佬用实际例子和数据证明降智了…比自己的主观感觉来的清晰多了
--【陆】--:
但是它没降智的时候,我的体感确实是它吊打其他全部模型啊,是全部
--【柒】--:
目前我还是使用codex进行兜底,速度慢了好几倍,但是真的很细节
--【捌】--:
可以尝试下,毕竟便宜点。GPT5.4好像也有点降智,观察了2天了
--【玖】--:
我觉得这只是问题没有涉及到那么多思考额度的要求,如果你的问题只需要64,那当然没有区别了。而且他现在感觉是思考努力程度降低,可以思考128的问题,他只思考64,是这种故意的思考程度降低,明显变笨很多。尤其是Claude是那种会给你很多你没有说,但是非常符合你要求的小改动,现在根本没有这种改动了,特别呆
--【拾】--:
我觉得没必要高估所谓降低思考程度的影响。
gpt5.4的话,juice 768的时候好用,512的时候也好用,128的时候也好用,不会因为砍一点思考额度就成傻子了。
--【拾壹】--:
实际上,并没有,或许你可以试试不掺水的官方模型,你说的这个问题完全没有出现过,而且,不存在所谓的讨好型输出。我的感受里,他对比GPT,是更加严谨的
--【拾贰】--:
所以说AI有时候用起来很爽 有时候能把人气死。且用且珍惜
--【拾叁】--:
没关系 codex能修复的,有这个兜底不要怕!
--【拾肆】--:
现在确实和弱智没啥区别,但现在是降智之后的,满血状态真的是强的没边
--【拾伍】--:
来看看这个吧:[MODEL] Claude Code is unusable for complex engineering tasks with the Feb updates · Issue #42796 · anthropics/claude-code · GitHub
有人找到了证据实锤 A\ 降智
--【拾陆】--:
没必要花时间折腾claude。我基本只有在测试环境或者过家家的时候才会用opus试试。opus的心智真的不适合做任何复杂严谨一些的东西,只会一次次地添乱。
--【拾柒】--:
这有点op黑了,op不降智是最舒服的模型。最近降智真的很恶心,唉,都不知道要不要续费max了
--【拾捌】--:
不只是你 基本大户都有感觉
目前最好的方法就是 effort max
然后拿codex兜底
没办法 新模型要上 鬼知道他们改了什么
--【拾玖】--:
佬,假也没办法啊,新模型出来要算力吧,A/也出了名的偷换模型玩家
image943×252 15.8 KB
image995×554 30 KB
20X账号,不存在任何掺水的可能性,直接是官方订阅登录的
原本的感受是,我说3,它能做10,但是这几天开始变成,我说,3,他只能做2或者1
原本的发散性和兜底全部没有了
除了人的直接感受之外,我的项目也能够证明,solodawn开发完了,再录效果视频,就在最后的攻坚,昨天,第一个测试任务跑完,评分是83,今天一模一样的任务跑完,评分是62
(solodawn这个项目的作用是 AI 全自动的开发,所以我给他定了测试任务和评分标准,在发布之前,是一遍又一遍的去跑这些测试任务。当然,跑之前肯定全部清空,不会复用之前的数据)
昨天0个TS错误,今天麽
image1223×1100 143 KB
这个模型能力降的也太多了,昨天是零个,今天直接跑测试的时候是72个,然后我感觉是不是我的整体架构有问题,所以去修,修完架构统一,错误更多,因为在修之前
image832×142 22.3 KB
修之后不存在这个问题了,错误更多,这进一步证明就是模型的问题,这跟架构已经没关系了,我也是没招儿了
佬们感受到降智了没,而且正常来讲,如果你是官方,你应该都降智了 我是官方20X 的订阅呀
image1116×218 63.6 KB
A你又干畜生事儿!
一边发帖,一边又出来这种问题,新增批量模式,它居然少功能,在原本根本不会出现这种情况啊
清空数据都做不好了!!!这都能漏东西,都得清两次,清理、完成、重启这种事情,模型都不会了吗?
image1140×626 86.7 KB
你*****
4月8日21点52分最新更新,换成 GLM5.1了,整个计划直接全部重跑,opus4.6彻底变为不可用状态,太弱智了,而且我能明显的感觉到,从3天前开始,一天比一天弱智,一天比一天弱智。现在,他终于弱智到了,我要,换回 GLM 了 6
image1937×694 241 KB
--【壹】--:
正好15号过期了,到时候考虑续不续费吧,我记得16号是吧?OpenAI 要发新模型,不行我就换
--【贰】--:
你可能被opus的所谓讨好型输出忽悠了。
在大型重构任务或者是一团混乱的局面下,只有gpt5.4才能力挽狂澜,opus4.6出场的话就是修两个bug造两个bug,无限循环下去,甚至连gpt5.1都不如。
--【叁】--:
用AI就是这样,没有一直保存第一,遇到算力不足降智、被其他模式超越情况
--【肆】--:
我这三四天用中转也是这样感觉,我都怀疑是中转参水,原来不是错觉。
--【伍】--:
佬用实际例子和数据证明降智了…比自己的主观感觉来的清晰多了
--【陆】--:
但是它没降智的时候,我的体感确实是它吊打其他全部模型啊,是全部
--【柒】--:
目前我还是使用codex进行兜底,速度慢了好几倍,但是真的很细节
--【捌】--:
可以尝试下,毕竟便宜点。GPT5.4好像也有点降智,观察了2天了
--【玖】--:
我觉得这只是问题没有涉及到那么多思考额度的要求,如果你的问题只需要64,那当然没有区别了。而且他现在感觉是思考努力程度降低,可以思考128的问题,他只思考64,是这种故意的思考程度降低,明显变笨很多。尤其是Claude是那种会给你很多你没有说,但是非常符合你要求的小改动,现在根本没有这种改动了,特别呆
--【拾】--:
我觉得没必要高估所谓降低思考程度的影响。
gpt5.4的话,juice 768的时候好用,512的时候也好用,128的时候也好用,不会因为砍一点思考额度就成傻子了。
--【拾壹】--:
实际上,并没有,或许你可以试试不掺水的官方模型,你说的这个问题完全没有出现过,而且,不存在所谓的讨好型输出。我的感受里,他对比GPT,是更加严谨的
--【拾贰】--:
所以说AI有时候用起来很爽 有时候能把人气死。且用且珍惜
--【拾叁】--:
没关系 codex能修复的,有这个兜底不要怕!
--【拾肆】--:
现在确实和弱智没啥区别,但现在是降智之后的,满血状态真的是强的没边
--【拾伍】--:
来看看这个吧:[MODEL] Claude Code is unusable for complex engineering tasks with the Feb updates · Issue #42796 · anthropics/claude-code · GitHub
有人找到了证据实锤 A\ 降智
--【拾陆】--:
没必要花时间折腾claude。我基本只有在测试环境或者过家家的时候才会用opus试试。opus的心智真的不适合做任何复杂严谨一些的东西,只会一次次地添乱。
--【拾柒】--:
这有点op黑了,op不降智是最舒服的模型。最近降智真的很恶心,唉,都不知道要不要续费max了
--【拾捌】--:
不只是你 基本大户都有感觉
目前最好的方法就是 effort max
然后拿codex兜底
没办法 新模型要上 鬼知道他们改了什么
--【拾玖】--:
佬,假也没办法啊,新模型出来要算力吧,A/也出了名的偷换模型玩家

