GPT 5.5 MRCR v2成绩如何?
- 内容介绍
- 文章标签
- 相关推荐
在1M 8针 场景 能赢Opus 4.6吗?
网友解答:--【壹】--:
这个完全就是A÷神经病
Opus 4.6那会测的还是MRCR v2,到了Opus 4.7的时候发现MRCR v2成绩没法看,里面变脸说MRCR v2是一个垃圾的测试,无法正确反映模型的长上下文能力
--【贰】--:
不能尽信A\ 的说法
他们把Opus 4.6 高分降到Opus 4.7程度
他们下一版 敢保持Opus 4.7程度(不能高于)吗? hhh
--【叁】--:
如图所示:
202604240906481672×941 82.9 KB
--【肆】--:
image1878×1642 235 KB
这次oai的model card巨长
从小作文变成了大作文
这个在最下面
还有这种意味不明的东西我怎么记得4.7其实也测了的
image394×282 7.47 KB
找到了 果然是经典的OAI对比法。。。人家4.7明明写了graphwalks但是奥特曼不用
image1784×1004 142 KB
--【伍】--:
A\的借口是很抽象辣
佬,框框里面截图的是那个a\自己的graphwalk,不晓得为啥oai要把4.6的混进来
在1M 8针 场景 能赢Opus 4.6吗?
网友解答:--【壹】--:
这个完全就是A÷神经病
Opus 4.6那会测的还是MRCR v2,到了Opus 4.7的时候发现MRCR v2成绩没法看,里面变脸说MRCR v2是一个垃圾的测试,无法正确反映模型的长上下文能力
--【贰】--:
不能尽信A\ 的说法
他们把Opus 4.6 高分降到Opus 4.7程度
他们下一版 敢保持Opus 4.7程度(不能高于)吗? hhh
--【叁】--:
如图所示:
202604240906481672×941 82.9 KB
--【肆】--:
image1878×1642 235 KB
这次oai的model card巨长
从小作文变成了大作文
这个在最下面
还有这种意味不明的东西我怎么记得4.7其实也测了的
image394×282 7.47 KB
找到了 果然是经典的OAI对比法。。。人家4.7明明写了graphwalks但是奥特曼不用
image1784×1004 142 KB
--【伍】--:
A\的借口是很抽象辣
佬,框框里面截图的是那个a\自己的graphwalk,不晓得为啥oai要把4.6的混进来

