看到有佬友说这个metaAI最新模型评分据说超过opus4.6,我赶紧去体验了一下

2026-04-13 12:481阅读0评论SEO问题
  • 内容介绍
  • 文章标签
  • 相关推荐
问题描述:

刷帖子看到有佬友说这个Meta家最新出的这个模型评分据说超过opus 4.6我刚试了一下,这思维逻辑确实厉害呀,关键是还免费呀,扔了一道测试opus的题目给它做,以下是它的回答,这思考确实有点东西呀
17757267426912408×1391 176 KB
17757267470562181×1383 285 KB
17757274552931725×1449 238 KB

光看这个思考来说,确实对标4.6了

网友解答:
--【壹】--:

和其他模型比差不多是这样,可供参考。

image1920×1421 401 KB


--【贰】--:

开源模型吗?可以媲美gpt的5.4还是5.3??


--【叁】--:

分享一个测试claude 中转站是否掺水的最简单的方法:

把下面内容发给你的claude,满血的会在思考2min左右后,回答出 21 这个正确答案,
渠道反代基本表现为,在很短的思考时间后,回答出一个 29 的错误答案(还有一些更垃圾更降智的渠道,比如copilot 365、以及snowflake里面的opus,会回答出34这个抽象答案)

在一个黑色的袋子里放有三种口味的糖果,每种糖果有两种不同的形状(圆形和五角星形,不同的形状靠手感可以分辨)。现已知不同口味的糖和不同形状的数量统计如下表。

阅读全文
问题描述:

刷帖子看到有佬友说这个Meta家最新出的这个模型评分据说超过opus 4.6我刚试了一下,这思维逻辑确实厉害呀,关键是还免费呀,扔了一道测试opus的题目给它做,以下是它的回答,这思考确实有点东西呀
17757267426912408×1391 176 KB
17757267470562181×1383 285 KB
17757274552931725×1449 238 KB

光看这个思考来说,确实对标4.6了

网友解答:
--【壹】--:

和其他模型比差不多是这样,可供参考。

image1920×1421 401 KB


--【贰】--:

开源模型吗?可以媲美gpt的5.4还是5.3??


--【叁】--:

分享一个测试claude 中转站是否掺水的最简单的方法:

把下面内容发给你的claude,满血的会在思考2min左右后,回答出 21 这个正确答案,
渠道反代基本表现为,在很短的思考时间后,回答出一个 29 的错误答案(还有一些更垃圾更降智的渠道,比如copilot 365、以及snowflake里面的opus,会回答出34这个抽象答案)

在一个黑色的袋子里放有三种口味的糖果,每种糖果有两种不同的形状(圆形和五角星形,不同的形状靠手感可以分辨)。现已知不同口味的糖和不同形状的数量统计如下表。

阅读全文