我来唱个反调:感觉Opus4.7没有那么不堪
- 内容介绍
- 文章标签
- 相关推荐
Opus 4.7上线后吐槽非常多,整体评价为“多半差评”,特别是在SmallMain佬友的测评里排到了T3去了,这位佬友的榜单基本比较符合我使用的感觉,我也就没有第一时间切换到4.7。
但是我又喜欢赤点石 (之前把玩了下Claude-mem这坨大份)遂准备来尝尝4.7的咸淡,两天使用下来整体感觉要比预想中好很多!我简单分析了下,Opus4.7最被人诟病的几点主要是:
- 长上下文的注意力相比前一代下降非常多
- 口癖像GPT,不说人话
- 思考努力程度改为自适应
逐个拆解下:
- 我基本只用到100多K的上下文需求就差不多解决或者直接新开会话了,注意力这点对我没啥影响
- 口癖暂时没发现像GPT,并没有看到一刀一刀、接住你等黑话,整体风格还是很“Claude”
- 思考强度我是默认的xhigh,然后关闭了自适应思考
最让我惊喜的是它相比起4.6,对skills的调用以及提示词的遵守都更积极了,简单说两点:
- 我在提示词中要求判断任务结束时在回复最后加一个标记,方便被hook捕获触发归档;这个设置在opus4.6时期几乎从未触发过,全部都需要我手动输入“归档”
- 对ace-tools MCP、PUA skill的调用更积极了,现在搜东西经常看到调用ace去搜,然后在输出里经常看到有PUA的痕迹
关于这点我去查了下官方文档,原话是“以往模型可能较为宽松地理解指令,甚至完全忽略部分内容,而 Opus 4.7 会更严格地按字面执行指令。用户应相应地重新调整提示词和测试流程。”
image373×224 5.78 KBimage421×193 4.51 KB
如上图,均输出了归档标记
--【壹】--:
我感觉最近几天4.7体验有所好转,4.7出来之前的一段时间 & 4.7刚出来的那几天讲话都是满满的gpt风味,最近几天感觉好一些了
--【贰】--: ⚡️我钢铁侠🔋:
之前把玩了下Claude-mem这坨大份
佬,这个细说下,我现在就在用,也不知道到底有没有用。反正我看现在已经3个多G了
--【叁】--:
也许是这个原因,我错过了赤Opus4.7第一波最热乎石的时候,可能后面A\把模型能力调回来一些了
--【肆】--:
其实也是对Claude-mem这坨大份的吐槽,简单说就是你在用Claude Code的时候它在后台再开一个Claude Code实时总结当前这个会话,有点类似于速记员的概念;只能说如果你额度非常的充裕完全用不完的话可以玩玩,不然完全不推荐
https://linux.do/t/topic/2027291
--【伍】--:
不是说只能在这个窗口才能保持注意力,而是我根本就没到注意力大幅下降那一步(虽然初始就不高),所以这块的削弱对我影响不大
--【陆】--:
我做了一波测试之后 发现4.6跟4.7还是有所区别的
在归档标记的情况下可以更加的清楚整体的工作任务在什么情况下执行了这个标记
以及对比4.6的话。虽说它确实看着很像gpt 但是4.7的思考反而快了许多。甚至是不需要打开这个思考。
--【柒】--:
上下文还好,现在体验下来感觉4.7更像一位架构师,更像那种能在一堆垃圾里面抽取骨干的大佬,细节问题他在需要的时候会回去验证,对于整个架构还是抓的挺准的
--【捌】--:
那你这结论就有点不太妥了:
-
4.7被人诟病的就是长上下文能力差,你的场景只能说明100K内可能没有这个问题。但这证明不了4.7的长上下文没有问题。
-
4.7的说话问题其实已经有很多截图的例子说明有这个问题了,但主要集中在Claude web,在code环境下会好一点。
-
自适应思考只在Claude Web有这个选项,在code中的使用场景是不能证明自适应思考没有问题的。
简而言之,现在的结果只能说明4.7在指令遵循和工具调用能力上有改进,这也是Claude官方的说辞。
--【玖】--:
100K才完整窗口的十分之一,如果只有在这个窗口才能保持注意力,那得跟Gemini坐一桌了。
--【拾】--:
话说 claude 昨天出了报告,称修复了质量下降的问题,佬友实测的体感提升会不会和这个有关
An update on recent Claude Code quality reports
Anthropic is an AI safety and research company that's working to build reliable, interpretable, and steerable AI systems.
--【拾壹】--: ⚡️我钢铁侠🔋:
口癖暂时没发现像GPT,并没有看到一刀一刀、接住你等黑话,整体风格还是很“Claude”
口癖我有受害记录
啥叫“奇鱼”啊?opus 4.7新词汇-增加”蛎图,张力仲裁,叙事锚点弧光“ 开发调优今天给我输出这个,这个词我是闻所未闻,搜索论坛一个帖子都没有提到的。这都是哪的黑话?? [image] 又出来一个,准备持续更新,看有多少新词 继续
--【拾贰】--:
不说人话这会导致我毫无跟gpt聊天的想法,看回复看的我头都大了。
Opus 4.7上线后吐槽非常多,整体评价为“多半差评”,特别是在SmallMain佬友的测评里排到了T3去了,这位佬友的榜单基本比较符合我使用的感觉,我也就没有第一时间切换到4.7。
但是我又喜欢赤点石 (之前把玩了下Claude-mem这坨大份)遂准备来尝尝4.7的咸淡,两天使用下来整体感觉要比预想中好很多!我简单分析了下,Opus4.7最被人诟病的几点主要是:
- 长上下文的注意力相比前一代下降非常多
- 口癖像GPT,不说人话
- 思考努力程度改为自适应
逐个拆解下:
- 我基本只用到100多K的上下文需求就差不多解决或者直接新开会话了,注意力这点对我没啥影响
- 口癖暂时没发现像GPT,并没有看到一刀一刀、接住你等黑话,整体风格还是很“Claude”
- 思考强度我是默认的xhigh,然后关闭了自适应思考
最让我惊喜的是它相比起4.6,对skills的调用以及提示词的遵守都更积极了,简单说两点:
- 我在提示词中要求判断任务结束时在回复最后加一个标记,方便被hook捕获触发归档;这个设置在opus4.6时期几乎从未触发过,全部都需要我手动输入“归档”
- 对ace-tools MCP、PUA skill的调用更积极了,现在搜东西经常看到调用ace去搜,然后在输出里经常看到有PUA的痕迹
关于这点我去查了下官方文档,原话是“以往模型可能较为宽松地理解指令,甚至完全忽略部分内容,而 Opus 4.7 会更严格地按字面执行指令。用户应相应地重新调整提示词和测试流程。”
image373×224 5.78 KBimage421×193 4.51 KB
如上图,均输出了归档标记
--【壹】--:
我感觉最近几天4.7体验有所好转,4.7出来之前的一段时间 & 4.7刚出来的那几天讲话都是满满的gpt风味,最近几天感觉好一些了
--【贰】--: ⚡️我钢铁侠🔋:
之前把玩了下Claude-mem这坨大份
佬,这个细说下,我现在就在用,也不知道到底有没有用。反正我看现在已经3个多G了
--【叁】--:
也许是这个原因,我错过了赤Opus4.7第一波最热乎石的时候,可能后面A\把模型能力调回来一些了
--【肆】--:
其实也是对Claude-mem这坨大份的吐槽,简单说就是你在用Claude Code的时候它在后台再开一个Claude Code实时总结当前这个会话,有点类似于速记员的概念;只能说如果你额度非常的充裕完全用不完的话可以玩玩,不然完全不推荐
https://linux.do/t/topic/2027291
--【伍】--:
不是说只能在这个窗口才能保持注意力,而是我根本就没到注意力大幅下降那一步(虽然初始就不高),所以这块的削弱对我影响不大
--【陆】--:
我做了一波测试之后 发现4.6跟4.7还是有所区别的
在归档标记的情况下可以更加的清楚整体的工作任务在什么情况下执行了这个标记
以及对比4.6的话。虽说它确实看着很像gpt 但是4.7的思考反而快了许多。甚至是不需要打开这个思考。
--【柒】--:
上下文还好,现在体验下来感觉4.7更像一位架构师,更像那种能在一堆垃圾里面抽取骨干的大佬,细节问题他在需要的时候会回去验证,对于整个架构还是抓的挺准的
--【捌】--:
那你这结论就有点不太妥了:
-
4.7被人诟病的就是长上下文能力差,你的场景只能说明100K内可能没有这个问题。但这证明不了4.7的长上下文没有问题。
-
4.7的说话问题其实已经有很多截图的例子说明有这个问题了,但主要集中在Claude web,在code环境下会好一点。
-
自适应思考只在Claude Web有这个选项,在code中的使用场景是不能证明自适应思考没有问题的。
简而言之,现在的结果只能说明4.7在指令遵循和工具调用能力上有改进,这也是Claude官方的说辞。
--【玖】--:
100K才完整窗口的十分之一,如果只有在这个窗口才能保持注意力,那得跟Gemini坐一桌了。
--【拾】--:
话说 claude 昨天出了报告,称修复了质量下降的问题,佬友实测的体感提升会不会和这个有关
An update on recent Claude Code quality reports
Anthropic is an AI safety and research company that's working to build reliable, interpretable, and steerable AI systems.
--【拾壹】--: ⚡️我钢铁侠🔋:
口癖暂时没发现像GPT,并没有看到一刀一刀、接住你等黑话,整体风格还是很“Claude”
口癖我有受害记录
啥叫“奇鱼”啊?opus 4.7新词汇-增加”蛎图,张力仲裁,叙事锚点弧光“ 开发调优今天给我输出这个,这个词我是闻所未闻,搜索论坛一个帖子都没有提到的。这都是哪的黑话?? [image] 又出来一个,准备持续更新,看有多少新词 继续
--【拾贰】--:
不说人话这会导致我毫无跟gpt聊天的想法,看回复看的我头都大了。

