DeepSeek V4的LiveBench分数出来了

2026-04-29 08:251阅读0评论SEO资讯

内容介绍
文章标签
相关推荐

问题描述：

1996×905 49.8 KB
1981×800 51.7 KB

livebench.ai

LiveBench

网友解答：

--【壹】--：

gemini3.1这么强的吗，难道是前端方面的

--【贰】--：

不如opencode-go的调用次数限制更符合生产实测，数据来的又慢又偏颇

--【叁】--：

目前 DeepSeek V4 还是预览版，期待后续能进一步提升

--【肆】--：

编码能力5.2codex最强啊，这合理吗

--【伍】--：

主要还是因为缺数据吧！网页版用户大多都是用来聊天的，模型太长时间不更新，API用户也少了。所以现在降价，估计是要收集优质数据，在后续版本中提升Coding能力

--【陆】--：

成绩很客观，Coding差一些，分数也体现出来了，综合实力还是挺强的

--【柒】--：

这榜单是用什么标准排的，coding里分数最高的是gpt 5.2 codex

--【捌】--：

这个榜单的Coding分数确实很抽象啊，claude-4-sonnet甚至能排在claude-4-6-opus前面
image686×814 29.3 KB

--【玖】--：

就coding分数差一些，但是这么多测评，分数确实就像之前有个媒体报道的，开源第一

--【拾】--：

这榜单里V4 coding还没自己3.2强吗，另外怎么没看到5.1在哪

标签：DeepSeek 人工智能

问题描述：

1996×905 49.8 KB
1981×800 51.7 KB

livebench.ai

LiveBench

网友解答：

--【壹】--：

gemini3.1这么强的吗，难道是前端方面的

--【贰】--：

不如opencode-go的调用次数限制更符合生产实测，数据来的又慢又偏颇

--【叁】--：

目前 DeepSeek V4 还是预览版，期待后续能进一步提升

--【肆】--：

编码能力5.2codex最强啊，这合理吗

--【伍】--：

--【陆】--：

成绩很客观，Coding差一些，分数也体现出来了，综合实力还是挺强的

--【柒】--：

这榜单是用什么标准排的，coding里分数最高的是gpt 5.2 codex

--【捌】--：

这个榜单的Coding分数确实很抽象啊，claude-4-sonnet甚至能排在claude-4-6-opus前面
image686×814 29.3 KB

--【玖】--：

就coding分数差一些，但是这么多测评，分数确实就像之前有个媒体报道的，开源第一

--【拾】--：

这榜单里V4 coding还没自己3.2强吗，另外怎么没看到5.1在哪

标签：DeepSeek 人工智能

LiveBench

相关推荐

LiveBench

相关推荐