看到有佬友说这个metaAI最新模型评分据说超过opus4.6,我赶紧去体验了一下

2026-04-13 12:482阅读0评论SEO问题
  • 内容介绍
  • 文章标签
  • 相关推荐
问题描述:

刷帖子看到有佬友说这个Meta家最新出的这个模型评分据说超过opus 4.6我刚试了一下,这思维逻辑确实厉害呀,关键是还免费呀,扔了一道测试opus的题目给它做,以下是它的回答,这思考确实有点东西呀
17757267426912408×1391 176 KB
17757267470562181×1383 285 KB
17757274552931725×1449 238 KB

光看这个思考来说,确实对标4.6了

网友解答:
--【壹】--:

和其他模型比差不多是这样,可供参考。

image1920×1421 401 KB


--【贰】--:

开源模型吗?可以媲美gpt的5.4还是5.3??


--【叁】--:

分享一个测试claude 中转站是否掺水的最简单的方法:

把下面内容发给你的claude,满血的会在思考2min左右后,回答出 21 这个正确答案,
渠道反代基本表现为,在很短的思考时间后,回答出一个 29 的错误答案(还有一些更垃圾更降智的渠道,比如copilot 365、以及snowflake里面的opus,会回答出34这个抽象答案)

在一个黑色的袋子里放有三种口味的糖果,每种糖果有两种不同的形状(圆形和五角星形,不同的形状靠手感可以分辨)。现已知不同口味的糖和不同形状的数量统计如下表。参赛者需要在活动前决定摸出的糖果数目,那么,最少取出多少个糖果才能保证手中同时拥有不同形状的苹果味和桃子味的糖?(同时手中有圆形苹果味匹配五角星桃子味糖果,或者有圆形桃子味匹配五角星苹果味糖果都满足要求) 苹果味桃子味西瓜味 圆形798 五角星形764


--【肆】--:

image574×107 5.35 KB
有点逗了


--【伍】--:

这个要用家宽才能进,ins家好像一直对ip质量要求比较高


--【陆】--:

没有api有点鸡肋,不能直接操纵电脑,还得通过网页去对话


--【柒】--:

我看有帖子说这个网站都可以当作IP质量检测网站了,质量不好的都会显示所在地区不可用


--【捌】--:

我登录进去了,但是回答就报错,不知道为啥


--【玖】--:

Meta 这个新的模型好像确实是挺厉害的,如果有更大更便宜的,基本上日常问答就能代替 GPT 了


--【拾】--:

佬友,这个您是怎么登录的,好像对节点要求很严格呀


--【拾壹】--:

好吧,看来我要找点更纯洁的ip了,这个我用了半年gemini和gpt都没被封,我还以为很纯洁了


--【拾贰】--:

他公布出来的评分里面的健康知识比4.6高,但是编程能力低很多.


--【拾叁】--:

为什么我用的美国cn2专线网络,他也会提示我所在的地区无法使用


--【拾肆】--:

佬 除了美国 还有哪个区域可以用呢? 我刚刚试了下日本 新加坡都不行


--【拾伍】--:

编程不太行,不过他的图片识别好像比谷歌还好。而且实际上分数是比4.6opus低一分的


--【拾陆】--:

思考时间很快,感觉还行,可能是用的人少回答速度挺让人满意的


--【拾柒】--:

超的是Sonnet 4.6 不是 Opus


--【拾捌】--:

佬你问的这个问题是啥,我也去试试能不能发下


--【拾玖】--:

这个模型不太行,第一遍算29。告诉他21,也不认可啊

问题描述:

刷帖子看到有佬友说这个Meta家最新出的这个模型评分据说超过opus 4.6我刚试了一下,这思维逻辑确实厉害呀,关键是还免费呀,扔了一道测试opus的题目给它做,以下是它的回答,这思考确实有点东西呀
17757267426912408×1391 176 KB
17757267470562181×1383 285 KB
17757274552931725×1449 238 KB

光看这个思考来说,确实对标4.6了

网友解答:
--【壹】--:

和其他模型比差不多是这样,可供参考。

image1920×1421 401 KB


--【贰】--:

开源模型吗?可以媲美gpt的5.4还是5.3??


--【叁】--:

分享一个测试claude 中转站是否掺水的最简单的方法:

把下面内容发给你的claude,满血的会在思考2min左右后,回答出 21 这个正确答案,
渠道反代基本表现为,在很短的思考时间后,回答出一个 29 的错误答案(还有一些更垃圾更降智的渠道,比如copilot 365、以及snowflake里面的opus,会回答出34这个抽象答案)

在一个黑色的袋子里放有三种口味的糖果,每种糖果有两种不同的形状(圆形和五角星形,不同的形状靠手感可以分辨)。现已知不同口味的糖和不同形状的数量统计如下表。参赛者需要在活动前决定摸出的糖果数目,那么,最少取出多少个糖果才能保证手中同时拥有不同形状的苹果味和桃子味的糖?(同时手中有圆形苹果味匹配五角星桃子味糖果,或者有圆形桃子味匹配五角星苹果味糖果都满足要求) 苹果味桃子味西瓜味 圆形798 五角星形764


--【肆】--:

image574×107 5.35 KB
有点逗了


--【伍】--:

这个要用家宽才能进,ins家好像一直对ip质量要求比较高


--【陆】--:

没有api有点鸡肋,不能直接操纵电脑,还得通过网页去对话


--【柒】--:

我看有帖子说这个网站都可以当作IP质量检测网站了,质量不好的都会显示所在地区不可用


--【捌】--:

我登录进去了,但是回答就报错,不知道为啥


--【玖】--:

Meta 这个新的模型好像确实是挺厉害的,如果有更大更便宜的,基本上日常问答就能代替 GPT 了


--【拾】--:

佬友,这个您是怎么登录的,好像对节点要求很严格呀


--【拾壹】--:

好吧,看来我要找点更纯洁的ip了,这个我用了半年gemini和gpt都没被封,我还以为很纯洁了


--【拾贰】--:

他公布出来的评分里面的健康知识比4.6高,但是编程能力低很多.


--【拾叁】--:

为什么我用的美国cn2专线网络,他也会提示我所在的地区无法使用


--【拾肆】--:

佬 除了美国 还有哪个区域可以用呢? 我刚刚试了下日本 新加坡都不行


--【拾伍】--:

编程不太行,不过他的图片识别好像比谷歌还好。而且实际上分数是比4.6opus低一分的


--【拾陆】--:

思考时间很快,感觉还行,可能是用的人少回答速度挺让人满意的


--【拾柒】--:

超的是Sonnet 4.6 不是 Opus


--【拾捌】--:

佬你问的这个问题是啥,我也去试试能不能发下


--【拾玖】--:

这个模型不太行,第一遍算29。告诉他21,也不认可啊