Deepseek v4 Pro的编程评测补充
- 内容介绍
- 文章标签
- 相关推荐
问题描述:
--【壹】--:
--【贰】--:
我的结论:与其看个人水榜还不如看知名榜单SWE
image878×354 63.5 KB
为啥不能看个人水榜?答案如图
image855×826 50.4 KB
--【壹】--:
按他这么说,怎么v4pro刚出来没几个小时就全测完了呢?确实有点离谱
--【贰】--:
我记得SWE会采用github最新的issue来作为问题,不会被大模型训练收录,而很多个人博主的题库一般都是反复测过的老题,大模型训练多少会看过
问题描述:
--【壹】--:
--【贰】--:
我的结论:与其看个人水榜还不如看知名榜单SWE
image878×354 63.5 KB
为啥不能看个人水榜?答案如图
image855×826 50.4 KB
--【壹】--:
按他这么说,怎么v4pro刚出来没几个小时就全测完了呢?确实有点离谱
--【贰】--:
我记得SWE会采用github最新的issue来作为问题,不会被大模型训练收录,而很多个人博主的题库一般都是反复测过的老题,大模型训练多少会看过

