150$M的Claude Opus 4.6 Fast可能更蠢???

2026-04-11 15:291阅读0评论SEO问题
  • 内容介绍
  • 文章标签
  • 相关推荐
问题描述:

先丢个暴论:你多花5倍价格用的fast可能比opus蠢

渠道是自建的官转,下面是测试糖果题( 目前(2026/03/16)鉴定 Claude Opus 4.6 真假的 3 个常规方法。 - 搞七捻三 - LINUX DO的一些思考

下面是乱码美咲的Fast和非Fast的回答
image2059×843 140 KB
image2070×823 133 KB
可以观察到非Fast已经修复了这个bug,但是Fast还没有(?

然后是糖果题的回答
image2014×1033 273 KB
image2032×1044 236 KB
最后是在CC设置effort=max,然后用claude-opus-4.6-fast模型做糖果题
7db869aef141da86d73788ecf6660fd81734×957 67.4 KB

所以是否意味着

1.Fast只能加快TTFT和TPS,并不能加速思考?

根据 目前(2026/03/16)鉴定 Claude Opus 4.6 真假的 3 个常规方法。 - 搞七捻三 - LINUX DO,常规opus要思考两分钟左右,claude-opus-4.6-fast (effort=max)也思考了两分钟左右,然后丢出来21。
image1389×331 17.9 KB

满血的会在思考2min左右后,回答出 21 这个正确答案, 渠道反代基本表现为,在很短的思考时间后,回答出一个 29 的错误答案(还有一些更垃圾更降智的渠道,比如copilot 365、以及snowflake里面的opus,会回答出34这个抽象答案) 测下来ultra相对是目前最划算的了,虽然昨天有佬友测出来ultra也降低额度了(850次/5h降到425/5h)、以及因为ag系统提示词过长导致的降智等问题…但它量大安全好获取呀 :lark_029: 目前我测出来原生“智商”的opus渠道,只有openrouter、github copilot里的opus。剩下的现有渠道(kiro,cursor,ag)都或多或少因为系统提示词+opus过强的提示词遵循能力,多少有些降智。

2.乱码问题非fast回答正常,加上糖果题的综合表现,是否能得出结论:claude-opus-4.6-fast=更旧的版本(相对来说非fast的opus)+几乎不思考≈降智???**

网友解答:
--【壹】--:

乱码那个在4.6 opus似乎变成了偶发的, 并非必定触发的bug了

在Arena.ai测试下的非fast依旧是有概率触发乱码

所以可能fast可能这次roll到触发了, 而非fast没触发(

PixPin_2026-03-28_07-11-551589×759 208 KB
PixPin_2026-03-28_07-12-451556×702 197 KB


--【贰】--:

偷偷给你降智 狠狠赚一笔


--【叁】--:

我本来以为只是服务器优先处理fast队列


--【肆】--:

image360×360 51.7 KB


--【伍】--:

看我装阴唐他一手


--【陆】--:

不用FAST它也蠢,哈哈哈


--【柒】--:

fast意味着量化过可能


--【捌】--:

IMG_20260328_1214291078×3596 696 KB


--【玖】--:

看来不是量化


--【拾】--:

这样吗 学到了谢谢佬


--【拾壹】--:

确实fast在某些方面不如4.6thinking 而且基于windsurf的数据(实测6指问题+洗车问题只有oups 4.5跟4.5thinking全通过)加上我自己的感觉(感觉4.6没有以前4.5thinking那个时候好用),说不出来,大家包括我都在用4.6了。不过再测试结果 4.6 又行,总之 4.5 也确实强


--【拾贰】--:

1m理论上来说会因为上下文变长导致注意力下降所以会变蠢,但是fast,我还没具体搞清楚为什么


--【拾叁】--:

立马把我的 1m 换掉


--【拾肆】--:

难绷了,加钱买更蠢的模型


--【拾伍】--:

4.5 thinking是哪个版本佬


--【拾陆】--:

在一个黑色的袋子里放有三种口味的糖果,这个厉害了。。满血确实能想 2~3分钟.
常规的那款,其实挺能打的。,
360截图20260328025229893970×630 40.1 KB
----,
360截图20260328025631176850×821 74.5 KB


--【拾柒】--:

好大的图


--【拾捌】--:

fast 和 1m 都不如原版吗,哈哈,A\真是太搞了

问题描述:

先丢个暴论:你多花5倍价格用的fast可能比opus蠢

渠道是自建的官转,下面是测试糖果题( 目前(2026/03/16)鉴定 Claude Opus 4.6 真假的 3 个常规方法。 - 搞七捻三 - LINUX DO的一些思考

下面是乱码美咲的Fast和非Fast的回答
image2059×843 140 KB
image2070×823 133 KB
可以观察到非Fast已经修复了这个bug,但是Fast还没有(?

然后是糖果题的回答
image2014×1033 273 KB
image2032×1044 236 KB
最后是在CC设置effort=max,然后用claude-opus-4.6-fast模型做糖果题
7db869aef141da86d73788ecf6660fd81734×957 67.4 KB

所以是否意味着

1.Fast只能加快TTFT和TPS,并不能加速思考?

根据 目前(2026/03/16)鉴定 Claude Opus 4.6 真假的 3 个常规方法。 - 搞七捻三 - LINUX DO,常规opus要思考两分钟左右,claude-opus-4.6-fast (effort=max)也思考了两分钟左右,然后丢出来21。
image1389×331 17.9 KB

满血的会在思考2min左右后,回答出 21 这个正确答案, 渠道反代基本表现为,在很短的思考时间后,回答出一个 29 的错误答案(还有一些更垃圾更降智的渠道,比如copilot 365、以及snowflake里面的opus,会回答出34这个抽象答案) 测下来ultra相对是目前最划算的了,虽然昨天有佬友测出来ultra也降低额度了(850次/5h降到425/5h)、以及因为ag系统提示词过长导致的降智等问题…但它量大安全好获取呀 :lark_029: 目前我测出来原生“智商”的opus渠道,只有openrouter、github copilot里的opus。剩下的现有渠道(kiro,cursor,ag)都或多或少因为系统提示词+opus过强的提示词遵循能力,多少有些降智。

2.乱码问题非fast回答正常,加上糖果题的综合表现,是否能得出结论:claude-opus-4.6-fast=更旧的版本(相对来说非fast的opus)+几乎不思考≈降智???**

网友解答:
--【壹】--:

乱码那个在4.6 opus似乎变成了偶发的, 并非必定触发的bug了

在Arena.ai测试下的非fast依旧是有概率触发乱码

所以可能fast可能这次roll到触发了, 而非fast没触发(

PixPin_2026-03-28_07-11-551589×759 208 KB
PixPin_2026-03-28_07-12-451556×702 197 KB


--【贰】--:

偷偷给你降智 狠狠赚一笔


--【叁】--:

我本来以为只是服务器优先处理fast队列


--【肆】--:

image360×360 51.7 KB


--【伍】--:

看我装阴唐他一手


--【陆】--:

不用FAST它也蠢,哈哈哈


--【柒】--:

fast意味着量化过可能


--【捌】--:

IMG_20260328_1214291078×3596 696 KB


--【玖】--:

看来不是量化


--【拾】--:

这样吗 学到了谢谢佬


--【拾壹】--:

确实fast在某些方面不如4.6thinking 而且基于windsurf的数据(实测6指问题+洗车问题只有oups 4.5跟4.5thinking全通过)加上我自己的感觉(感觉4.6没有以前4.5thinking那个时候好用),说不出来,大家包括我都在用4.6了。不过再测试结果 4.6 又行,总之 4.5 也确实强


--【拾贰】--:

1m理论上来说会因为上下文变长导致注意力下降所以会变蠢,但是fast,我还没具体搞清楚为什么


--【拾叁】--:

立马把我的 1m 换掉


--【拾肆】--:

难绷了,加钱买更蠢的模型


--【拾伍】--:

4.5 thinking是哪个版本佬


--【拾陆】--:

在一个黑色的袋子里放有三种口味的糖果,这个厉害了。。满血确实能想 2~3分钟.
常规的那款,其实挺能打的。,
360截图20260328025229893970×630 40.1 KB
----,
360截图20260328025631176850×821 74.5 KB


--【拾柒】--:

好大的图


--【拾捌】--:

fast 和 1m 都不如原版吗,哈哈,A\真是太搞了