Deepseek v4 Pro的编程评测补充

2026-04-29 10:233阅读0评论SEO教程
  • 内容介绍
  • 文章标签
  • 相关推荐
问题描述:

我的结论:与其看个人水榜还不如看知名榜单SWE

image878×354 63.5 KB
为啥不能看个人水榜?答案如图
image855×826 50.4 KB

网友解答:
--【壹】--:

按他这么说,怎么v4pro刚出来没几个小时就全测完了呢?确实有点离谱


--【贰】--:

我记得SWE会采用github最新的issue来作为问题,不会被大模型训练收录,而很多个人博主的题库一般都是反复测过的老题,大模型训练多少会看过

问题描述:

我的结论:与其看个人水榜还不如看知名榜单SWE

image878×354 63.5 KB
为啥不能看个人水榜?答案如图
image855×826 50.4 KB

网友解答:
--【壹】--:

按他这么说,怎么v4pro刚出来没几个小时就全测完了呢?确实有点离谱


--【贰】--:

我记得SWE会采用github最新的issue来作为问题,不会被大模型训练收录,而很多个人博主的题库一般都是反复测过的老题,大模型训练多少会看过