GPT 5.5 MRCR v2成绩如何?

2026-04-29 10:491阅读0评论SEO问题
  • 内容介绍
  • 文章标签
  • 相关推荐
问题描述:

在1M 8针 场景 能赢Opus 4.6吗?

网友解答:
--【壹】--:

这个完全就是A÷神经病

Opus 4.6那会测的还是MRCR v2,到了Opus 4.7的时候发现MRCR v2成绩没法看,里面变脸说MRCR v2是一个垃圾的测试,无法正确反映模型的长上下文能力


--【贰】--:

不能尽信A\ 的说法

他们把Opus 4.6 高分降到Opus 4.7程度

他们下一版 敢保持Opus 4.7程度(不能高于)吗? hhh


--【叁】--:

如图所示:

202604240906481672×941 82.9 KB


--【肆】--:

image1878×1642 235 KB
这次oai的model card巨长
从小作文变成了大作文
这个在最下面

还有这种意味不明的东西我怎么记得4.7其实也测了的
image394×282 7.47 KB


找到了 果然是经典的OAI对比法。。。人家4.7明明写了graphwalks但是奥特曼不用
image1784×1004 142 KB


--【伍】--:

A\的借口是很抽象辣

佬,框框里面截图的是那个a\自己的graphwalk,不晓得为啥oai要把4.6的混进来

标签:人工智能
问题描述:

在1M 8针 场景 能赢Opus 4.6吗?

网友解答:
--【壹】--:

这个完全就是A÷神经病

Opus 4.6那会测的还是MRCR v2,到了Opus 4.7的时候发现MRCR v2成绩没法看,里面变脸说MRCR v2是一个垃圾的测试,无法正确反映模型的长上下文能力


--【贰】--:

不能尽信A\ 的说法

他们把Opus 4.6 高分降到Opus 4.7程度

他们下一版 敢保持Opus 4.7程度(不能高于)吗? hhh


--【叁】--:

如图所示:

202604240906481672×941 82.9 KB


--【肆】--:

image1878×1642 235 KB
这次oai的model card巨长
从小作文变成了大作文
这个在最下面

还有这种意味不明的东西我怎么记得4.7其实也测了的
image394×282 7.47 KB


找到了 果然是经典的OAI对比法。。。人家4.7明明写了graphwalks但是奥特曼不用
image1784×1004 142 KB


--【伍】--:

A\的借口是很抽象辣

佬,框框里面截图的是那个a\自己的graphwalk,不晓得为啥oai要把4.6的混进来

标签:人工智能