deepseek 开始了新一轮的灰度测试!

2026-04-11 10:321阅读0评论SEO问题
  • 内容介绍
  • 文章标签
  • 相关推荐
问题描述:

image737×821 62 KB
image536×867 86.2 KB
image400×867 76.1 KB
image828×675 86.6 KB

就在刚刚,群友发现DeepSeek开启了新一轮的灰度测试
本次灰测有两个大的变化
代码能力(SVG)
群友让他画一个常用的猴子骑车SVG
并对比了常用K2.5给的结果(图
可以看到效果明显好于之前的效果

思考质量和多轮搜索
新版DeepSeek的多轮搜索能力得到了大幅的提升
这里我让他搜了下阿里今天刚发的Qwen3.6-Plus
可以看到他进行了多次搜索(图
分段整理了Qwen3.6-Plus的不同信息
然后汇总了一个报告给我

并且还有就是在思考时的质量和效果都有了大量的提升
例如群友让他修改生成的SVG
新版本DeepSeek能在思考时分步修改(图
还是有很强提升的

考虑到之前有DS成员表示V4有个很大的版本
这个应该是V4的大参数版本
如果这次测试没有大问题的话
那应该清明节前(明天)就能上线了

狠狠期待一波
应该会是开源最强的Coding模型了!!

网友解答:
--【壹】--: L:

迪克浦西已经在后台了,让我们把他请出来好吗?

迪克浦西


--【贰】--:

那是你对deepseek的历史了解的比较晚吧?在R1出名之前的V3当时是国内coding最好的模型了。


--【叁】--:

image970×734 32.2 KB
猫抓老鼠SVG,能看出我的是灰度后的吗?


--【肆】--: funwell:

常用的猴子骑车SVG

一般都是画鹈鹕吧,这猴子也无法判断能力 ,能不能整个鹈鹕看看,
既然要判断是否灰度新模型,就应该拿之前做过的测试进行对比,而不是搞一个新的测试,这样没有对比的效果


--【伍】--:

从过年期待到现在了


--【陆】--:

天才 贫困 大学生要上线了吗


--【柒】--:

话说之前都认为deepseek不适合编程,主攻对话/数学,什么时候开始提高编程能力的
会有coding plan吗


--【捌】--:

主要是价格足够低就行


--【玖】--:

上下文上来了,编程应该容易很多,DeepSeek本来就强逻辑,可以期待一下


--【拾】--:

期待超越克劳德,之后就能用国产低价模型Coding了


--【拾壹】--:

这次是真狼来了吗


--【拾贰】--:

迪克浦西威寺就在后台让我们一起把他喊出来好吗


--【拾叁】--:

狠狠期待一波


--【拾肆】--:

上线的是多轮搜索 之前上线过一次被下了


--【拾伍】--:

刚好这两天全都无了,ds来吧!!!


--【拾陆】--:

要coding,要代码,好好治治claude


--【拾柒】--:

终于了吗


--【拾捌】--:

很急,能平替claude sonnet 4.6我就满足了


--【拾玖】--:

感觉没啥变化

问题描述:

image737×821 62 KB
image536×867 86.2 KB
image400×867 76.1 KB
image828×675 86.6 KB

就在刚刚,群友发现DeepSeek开启了新一轮的灰度测试
本次灰测有两个大的变化
代码能力(SVG)
群友让他画一个常用的猴子骑车SVG
并对比了常用K2.5给的结果(图
可以看到效果明显好于之前的效果

思考质量和多轮搜索
新版DeepSeek的多轮搜索能力得到了大幅的提升
这里我让他搜了下阿里今天刚发的Qwen3.6-Plus
可以看到他进行了多次搜索(图
分段整理了Qwen3.6-Plus的不同信息
然后汇总了一个报告给我

并且还有就是在思考时的质量和效果都有了大量的提升
例如群友让他修改生成的SVG
新版本DeepSeek能在思考时分步修改(图
还是有很强提升的

考虑到之前有DS成员表示V4有个很大的版本
这个应该是V4的大参数版本
如果这次测试没有大问题的话
那应该清明节前(明天)就能上线了

狠狠期待一波
应该会是开源最强的Coding模型了!!

网友解答:
--【壹】--: L:

迪克浦西已经在后台了,让我们把他请出来好吗?

迪克浦西


--【贰】--:

那是你对deepseek的历史了解的比较晚吧?在R1出名之前的V3当时是国内coding最好的模型了。


--【叁】--:

image970×734 32.2 KB
猫抓老鼠SVG,能看出我的是灰度后的吗?


--【肆】--: funwell:

常用的猴子骑车SVG

一般都是画鹈鹕吧,这猴子也无法判断能力 ,能不能整个鹈鹕看看,
既然要判断是否灰度新模型,就应该拿之前做过的测试进行对比,而不是搞一个新的测试,这样没有对比的效果


--【伍】--:

从过年期待到现在了


--【陆】--:

天才 贫困 大学生要上线了吗


--【柒】--:

话说之前都认为deepseek不适合编程,主攻对话/数学,什么时候开始提高编程能力的
会有coding plan吗


--【捌】--:

主要是价格足够低就行


--【玖】--:

上下文上来了,编程应该容易很多,DeepSeek本来就强逻辑,可以期待一下


--【拾】--:

期待超越克劳德,之后就能用国产低价模型Coding了


--【拾壹】--:

这次是真狼来了吗


--【拾贰】--:

迪克浦西威寺就在后台让我们一起把他喊出来好吗


--【拾叁】--:

狠狠期待一波


--【拾肆】--:

上线的是多轮搜索 之前上线过一次被下了


--【拾伍】--:

刚好这两天全都无了,ds来吧!!!


--【拾陆】--:

要coding,要代码,好好治治claude


--【拾柒】--:

终于了吗


--【拾捌】--:

很急,能平替claude sonnet 4.6我就满足了


--【拾玖】--:

感觉没啥变化