看到有佬友说这个metaAI最新模型评分据说超过opus4.6,我赶紧去体验了一下
- 内容介绍
- 文章标签
- 相关推荐
刷帖子看到有佬友说这个Meta家最新出的这个模型评分据说超过opus 4.6我刚试了一下,这思维逻辑确实厉害呀,关键是还免费呀,扔了一道测试opus的题目给它做,以下是它的回答,这思考确实有点东西呀
17757267426912408×1391 176 KB
17757267470562181×1383 285 KB
17757274552931725×1449 238 KB
光看这个思考来说,确实对标4.6了
网友解答:--【壹】--:
和其他模型比差不多是这样,可供参考。
image1920×1421 401 KB
--【贰】--:
开源模型吗?可以媲美gpt的5.4还是5.3??
--【叁】--:
分享一个测试claude 中转站是否掺水的最简单的方法:
把下面内容发给你的claude,满血的会在思考2min左右后,回答出 21 这个正确答案,
渠道反代基本表现为,在很短的思考时间后,回答出一个 29 的错误答案(还有一些更垃圾更降智的渠道,比如copilot 365、以及snowflake里面的opus,会回答出34这个抽象答案)
在一个黑色的袋子里放有三种口味的糖果,每种糖果有两种不同的形状(圆形和五角星形,不同的形状靠手感可以分辨)。现已知不同口味的糖和不同形状的数量统计如下表。
刷帖子看到有佬友说这个Meta家最新出的这个模型评分据说超过opus 4.6我刚试了一下,这思维逻辑确实厉害呀,关键是还免费呀,扔了一道测试opus的题目给它做,以下是它的回答,这思考确实有点东西呀
17757267426912408×1391 176 KB
17757267470562181×1383 285 KB
17757274552931725×1449 238 KB
光看这个思考来说,确实对标4.6了
网友解答:--【壹】--:
和其他模型比差不多是这样,可供参考。
image1920×1421 401 KB
--【贰】--:
开源模型吗?可以媲美gpt的5.4还是5.3??
--【叁】--:
分享一个测试claude 中转站是否掺水的最简单的方法:
把下面内容发给你的claude,满血的会在思考2min左右后,回答出 21 这个正确答案,
渠道反代基本表现为,在很短的思考时间后,回答出一个 29 的错误答案(还有一些更垃圾更降智的渠道,比如copilot 365、以及snowflake里面的opus,会回答出34这个抽象答案)
在一个黑色的袋子里放有三种口味的糖果,每种糖果有两种不同的形状(圆形和五角星形,不同的形状靠手感可以分辨)。现已知不同口味的糖和不同形状的数量统计如下表。

