deepseek 开始了新一轮的灰度测试!
- 内容介绍
- 文章标签
- 相关推荐
image737×821 62 KB
image536×867 86.2 KB
image400×867 76.1 KB
image828×675 86.6 KB
就在刚刚,群友发现DeepSeek开启了新一轮的灰度测试
本次灰测有两个大的变化
代码能力(SVG)
群友让他画一个常用的猴子骑车SVG
并对比了常用K2.5给的结果(图
可以看到效果明显好于之前的效果
思考质量和多轮搜索
新版DeepSeek的多轮搜索能力得到了大幅的提升
这里我让他搜了下阿里今天刚发的Qwen3.6-Plus
可以看到他进行了多次搜索(图
分段整理了Qwen3.6-Plus的不同信息
然后汇总了一个报告给我
并且还有就是在思考时的质量和效果都有了大量的提升
例如群友让他修改生成的SVG
新版本DeepSeek能在思考时分步修改(图
还是有很强提升的
考虑到之前有DS成员表示V4有个很大的版本
这个应该是V4的大参数版本
如果这次测试没有大问题的话
那应该清明节前(明天)就能上线了
狠狠期待一波
应该会是开源最强的Coding模型了!!
--【壹】--: L:
迪克浦西已经在后台了,让我们把他请出来好吗?
迪克浦西
--【贰】--:
那是你对deepseek的历史了解的比较晚吧?在R1出名之前的V3当时是国内coding最好的模型了。
--【叁】--:
image970×734 32.2 KB
猫抓老鼠SVG,能看出我的是灰度后的吗?
--【肆】--: funwell:
常用的猴子骑车SVG
一般都是画鹈鹕吧,这猴子也无法判断能力 ,能不能整个鹈鹕看看,
既然要判断是否灰度新模型,就应该拿之前做过的测试进行对比,而不是搞一个新的测试,这样没有对比的效果
--【伍】--:
从过年期待到现在了
--【陆】--:
天才 贫困 大学生要上线了吗
--【柒】--:
话说之前都认为deepseek不适合编程,主攻对话/数学,什么时候开始提高编程能力的
会有coding plan吗
--【捌】--:
主要是价格足够低就行
--【玖】--:
上下文上来了,编程应该容易很多,DeepSeek本来就强逻辑,可以期待一下
--【拾】--:
期待超越克劳德,之后就能用国产低价模型Coding了
--【拾壹】--:
这次是真狼来了吗
--【拾贰】--:
迪克浦西威寺就在后台让我们一起把他喊出来好吗
--【拾叁】--:
狠狠期待一波
--【拾肆】--:
上线的是多轮搜索 之前上线过一次被下了
--【拾伍】--:
刚好这两天全都无了,ds来吧!!!
--【拾陆】--:
要coding,要代码,好好治治claude
--【拾柒】--:
终于了吗
--【拾捌】--:
很急,能平替claude sonnet 4.6我就满足了
--【拾玖】--:
感觉没啥变化
image737×821 62 KB
image536×867 86.2 KB
image400×867 76.1 KB
image828×675 86.6 KB
就在刚刚,群友发现DeepSeek开启了新一轮的灰度测试
本次灰测有两个大的变化
代码能力(SVG)
群友让他画一个常用的猴子骑车SVG
并对比了常用K2.5给的结果(图
可以看到效果明显好于之前的效果
思考质量和多轮搜索
新版DeepSeek的多轮搜索能力得到了大幅的提升
这里我让他搜了下阿里今天刚发的Qwen3.6-Plus
可以看到他进行了多次搜索(图
分段整理了Qwen3.6-Plus的不同信息
然后汇总了一个报告给我
并且还有就是在思考时的质量和效果都有了大量的提升
例如群友让他修改生成的SVG
新版本DeepSeek能在思考时分步修改(图
还是有很强提升的
考虑到之前有DS成员表示V4有个很大的版本
这个应该是V4的大参数版本
如果这次测试没有大问题的话
那应该清明节前(明天)就能上线了
狠狠期待一波
应该会是开源最强的Coding模型了!!
--【壹】--: L:
迪克浦西已经在后台了,让我们把他请出来好吗?
迪克浦西
--【贰】--:
那是你对deepseek的历史了解的比较晚吧?在R1出名之前的V3当时是国内coding最好的模型了。
--【叁】--:
image970×734 32.2 KB
猫抓老鼠SVG,能看出我的是灰度后的吗?
--【肆】--: funwell:
常用的猴子骑车SVG
一般都是画鹈鹕吧,这猴子也无法判断能力 ,能不能整个鹈鹕看看,
既然要判断是否灰度新模型,就应该拿之前做过的测试进行对比,而不是搞一个新的测试,这样没有对比的效果
--【伍】--:
从过年期待到现在了
--【陆】--:
天才 贫困 大学生要上线了吗
--【柒】--:
话说之前都认为deepseek不适合编程,主攻对话/数学,什么时候开始提高编程能力的
会有coding plan吗
--【捌】--:
主要是价格足够低就行
--【玖】--:
上下文上来了,编程应该容易很多,DeepSeek本来就强逻辑,可以期待一下
--【拾】--:
期待超越克劳德,之后就能用国产低价模型Coding了
--【拾壹】--:
这次是真狼来了吗
--【拾贰】--:
迪克浦西威寺就在后台让我们一起把他喊出来好吗
--【拾叁】--:
狠狠期待一波
--【拾肆】--:
上线的是多轮搜索 之前上线过一次被下了
--【拾伍】--:
刚好这两天全都无了,ds来吧!!!
--【拾陆】--:
要coding,要代码,好好治治claude
--【拾柒】--:
终于了吗
--【拾捌】--:
很急,能平替claude sonnet 4.6我就满足了
--【拾玖】--:
感觉没啥变化

