强烈推荐大家参考Cursor最新推出的CursorBench,这应该是目前最好的Coding Benchmark

2026-04-11 14:320阅读0评论SEO问题
  • 内容介绍
  • 文章标签
  • 相关推荐
问题描述:

来自Cursor的CursorBench

20260313_1027562400×1800 116 KB

非常符合我的个人体感

推荐大家读一读Blog:

Cursor

我们如何在 Cursor 中比较模型质量 · Cursor

我们采用线上与线下结合的混合评测流程,让我们对模型质量的理解始终与开发者的真实工作方式保持一致。

网友解答:
--【壹】--:

问题是 5.4xhigh和high哪个性能更优呢,他这个benchmark想表达high更优?


--【贰】--:

感谢佬友!

xhigh好像没测评?


--【叁】--:

感谢推荐。


--【肆】--:

没测评xhigh,测了xhigh肯定是xhigh更优


--【伍】--:

5.4 high还是牛逼啊


--【陆】--:

感谢佬友


--【柒】--:

gpt强了,但用起来还是没claude舒服


--【捌】--:

注意文中的是 high 不是 xhigh


--【玖】--:

claude 太贵了,榜单打压一下w


--【拾】--:

国产模型就一个glm5,太惨了


--【拾壹】--:

希望这个数据集别开源,不然上面国产模型就要sota了。。。