强烈推荐大家参考Cursor最新推出的CursorBench,这应该是目前最好的Coding Benchmark
- 内容介绍
- 文章标签
- 相关推荐
问题描述:
Cursor
--【壹】--:
--【贰】--:
--【叁】--:
--【肆】--:
--【伍】--:
--【陆】--:
--【柒】--:
--【捌】--:
--【玖】--:
--【拾】--:
--【拾壹】--:
来自Cursor的CursorBench
20260313_1027562400×1800 116 KB
非常符合我的个人体感
推荐大家读一读Blog:
我们如何在 Cursor 中比较模型质量 · Cursor
我们采用线上与线下结合的混合评测流程,让我们对模型质量的理解始终与开发者的真实工作方式保持一致。
网友解答:--【壹】--:
问题是 5.4xhigh和high哪个性能更优呢,他这个benchmark想表达high更优?
--【贰】--:
感谢佬友!
xhigh好像没测评?
--【叁】--:
感谢推荐。
--【肆】--:
没测评xhigh,测了xhigh肯定是xhigh更优
--【伍】--:
5.4 high还是牛逼啊
--【陆】--:
感谢佬友
--【柒】--:
gpt强了,但用起来还是没claude舒服
--【捌】--:
注意文中的是 high 不是 xhigh
--【玖】--:
claude 太贵了,榜单打压一下w
--【拾】--:
国产模型就一个glm5,太惨了
--【拾壹】--:
希望这个数据集别开源,不然上面国产模型就要sota了。。。
问题描述:
Cursor
--【壹】--:
--【贰】--:
--【叁】--:
--【肆】--:
--【伍】--:
--【陆】--:
--【柒】--:
--【捌】--:
--【玖】--:
--【拾】--:
--【拾壹】--:
来自Cursor的CursorBench
20260313_1027562400×1800 116 KB
非常符合我的个人体感
推荐大家读一读Blog:
我们如何在 Cursor 中比较模型质量 · Cursor
我们采用线上与线下结合的混合评测流程,让我们对模型质量的理解始终与开发者的真实工作方式保持一致。
网友解答:--【壹】--:
问题是 5.4xhigh和high哪个性能更优呢,他这个benchmark想表达high更优?
--【贰】--:
感谢佬友!
xhigh好像没测评?
--【叁】--:
感谢推荐。
--【肆】--:
没测评xhigh,测了xhigh肯定是xhigh更优
--【伍】--:
5.4 high还是牛逼啊
--【陆】--:
感谢佬友
--【柒】--:
gpt强了,但用起来还是没claude舒服
--【捌】--:
注意文中的是 high 不是 xhigh
--【玖】--:
claude 太贵了,榜单打压一下w
--【拾】--:
国产模型就一个glm5,太惨了
--【拾壹】--:
希望这个数据集别开源,不然上面国产模型就要sota了。。。

