对DeepSeek V4lite 0329的一些猜想
- 内容介绍
- 文章标签
- 相关推荐
昨天晚上,deepseek官网的模型出现了微妙变化
DeepSeek 可用了,客户端鹈鹕SVG,感觉还可以 前沿快讯不知道是不是V4,官方没消息就默认不是 还是没有视觉 ,之前的故障像是单纯的故障,还是太期待了 感兴趣的佬可以自己测试一下,效果图: [1] 生成的SVG代码: <svg xmlns="http://www.w3.org/2000/svg" viewBox="0 0 800 600" width="100%" height="100%"> <defs>…
综合测试发现,其所有其他能力全部没有明显进步(甚至可能退步),但只有SVG能力突飞猛进
image1092×796 110 KB
image1062×796 99.3 KB
并且有显著的Gemini风格
并且我们发现,只有在绘制SVG的任务中,思维链会陡然变为Gemini风格,这在deepseek历史上都没有过
image1005×464 103 KB
结合研究员陈德里几天前在小红书开启的关于RP思维链的设计问题
image358×656 58.4 KB
基本可以认为v4现在已经进入了后训练阶段。而官网的小模型进行了一种试验:
使用某种特定方法来控制思维链格式
我们可以明显看出0329的官网蒸馏了大量的Gemini 3.1 pro SVG内容。这对于模型本身和DeepSeek本身没有任何意义,甚至把其他能力变区了。SVG这个bench唯一的意义就是拿去X上给洋人烂炒。
但是当模型识别到这是一个SVG任务,思维链就会立刻转向与本身皆然相反的Gemini思维链。且在思维链中,Gemini式思考和3.2 speciale式思考互殴严重。这就导致了出来的东西四不像,能同时感觉的Gemini的风格和v4l的区。
昨天晚上,deepseek官网的模型出现了微妙变化
DeepSeek 可用了,客户端鹈鹕SVG,感觉还可以 前沿快讯不知道是不是V4,官方没消息就默认不是 还是没有视觉 ,之前的故障像是单纯的故障,还是太期待了 感兴趣的佬可以自己测试一下,效果图: [1] 生成的SVG代码: <svg xmlns="http://www.w3.org/2000/svg" viewBox="0 0 800 600" width="100%" height="100%"> <defs>…
综合测试发现,其所有其他能力全部没有明显进步(甚至可能退步),但只有SVG能力突飞猛进
image1092×796 110 KB
image1062×796 99.3 KB
并且有显著的Gemini风格
并且我们发现,只有在绘制SVG的任务中,思维链会陡然变为Gemini风格,这在deepseek历史上都没有过
image1005×464 103 KB
结合研究员陈德里几天前在小红书开启的关于RP思维链的设计问题
image358×656 58.4 KB
基本可以认为v4现在已经进入了后训练阶段。而官网的小模型进行了一种试验:
使用某种特定方法来控制思维链格式
我们可以明显看出0329的官网蒸馏了大量的Gemini 3.1 pro SVG内容。这对于模型本身和DeepSeek本身没有任何意义,甚至把其他能力变区了。SVG这个bench唯一的意义就是拿去X上给洋人烂炒。
但是当模型识别到这是一个SVG任务,思维链就会立刻转向与本身皆然相反的Gemini思维链。且在思维链中,Gemini式思考和3.2 speciale式思考互殴严重。这就导致了出来的东西四不像,能同时感觉的Gemini的风格和v4l的区。

