对DeepSeek V4lite 0329的一些猜想
- 内容介绍
- 文章标签
- 相关推荐
昨天晚上,deepseek官网的模型出现了微妙变化
DeepSeek 可用了,客户端鹈鹕SVG,感觉还可以 前沿快讯不知道是不是V4,官方没消息就默认不是 还是没有视觉 ,之前的故障像是单纯的故障,还是太期待了 感兴趣的佬可以自己测试一下,效果图: [1] 生成的SVG代码: <svg xmlns="http://www.w3.org/2000/svg" viewBox="0 0 800 600" width="100%" height="100%"> <defs>…
综合测试发现,其所有其他能力全部没有明显进步(甚至可能退步),但只有SVG能力突飞猛进
image1092×796 110 KB
image1062×796 99.3 KB
并且有显著的Gemini风格
并且我们发现,只有在绘制SVG的任务中,思维链会陡然变为Gemini风格,这在deepseek历史上都没有过
image1005×464 103 KB
结合研究员陈德里几天前在小红书开启的关于RP思维链的设计问题
image358×656 58.4 KB
基本可以认为v4现在已经进入了后训练阶段。而官网的小模型进行了一种试验:
使用某种特定方法来控制思维链格式
我们可以明显看出0329的官网蒸馏了大量的Gemini 3.1 pro SVG内容。这对于模型本身和DeepSeek本身没有任何意义,甚至把其他能力变区了。SVG这个bench唯一的意义就是拿去X上给洋人烂炒。
但是当模型识别到这是一个SVG任务,思维链就会立刻转向与本身皆然相反的Gemini思维链。且在思维链中,Gemini式思考和3.2 speciale式思考互殴严重。这就导致了出来的东西四不像,能同时感觉的Gemini的风格和v4l的区。
目前可以断定,这个能力几乎不可能带到正式版中,除了这个明目张胆蒸有点洗不干净,在为数不多的后训练时间里,应该还要调控各种各样的思维链样式
--【壹】--:
0330测试了一下,变回以前了
--【贰】--:
除了or的图标不太像以外剩下的不错啊
--【叁】--:
集百家之()
--【肆】--:
看来不能指望deepseek新版能有多少性能提升了
--【伍】--:
现在3.1p唯一的作用就是给我的项目生成一些SVG,不得不说复制的确实很好
--【陆】--:
不会是每一家都蒸馏,然后发三个模型吧
--【柒】--:
不必去猜,来了再说
--【捌】--:
这个我记得有个网站里面有现成的SVG,png等的图标
--【玖】--:
icon 都用SVG 画,就没版权了
--【拾】--:
说人话,审美好,编程强不可兼得吗
--【拾壹】--:
所以SVG除了烂炒以外有什么用呢)
--【拾贰】--:
补充
image328×135 6.61 KB
那就没问题了,
固定指令:SVG
parttern:Gemini思维链
--【拾叁】--:
御三家的能力聚集在一起吗,gemini的svg,oai的不说人话(已经优化),claude的编程
昨天晚上,deepseek官网的模型出现了微妙变化
DeepSeek 可用了,客户端鹈鹕SVG,感觉还可以 前沿快讯不知道是不是V4,官方没消息就默认不是 还是没有视觉 ,之前的故障像是单纯的故障,还是太期待了 感兴趣的佬可以自己测试一下,效果图: [1] 生成的SVG代码: <svg xmlns="http://www.w3.org/2000/svg" viewBox="0 0 800 600" width="100%" height="100%"> <defs>…
综合测试发现,其所有其他能力全部没有明显进步(甚至可能退步),但只有SVG能力突飞猛进
image1092×796 110 KB
image1062×796 99.3 KB
并且有显著的Gemini风格
并且我们发现,只有在绘制SVG的任务中,思维链会陡然变为Gemini风格,这在deepseek历史上都没有过
image1005×464 103 KB
结合研究员陈德里几天前在小红书开启的关于RP思维链的设计问题
image358×656 58.4 KB
基本可以认为v4现在已经进入了后训练阶段。而官网的小模型进行了一种试验:
使用某种特定方法来控制思维链格式
我们可以明显看出0329的官网蒸馏了大量的Gemini 3.1 pro SVG内容。这对于模型本身和DeepSeek本身没有任何意义,甚至把其他能力变区了。SVG这个bench唯一的意义就是拿去X上给洋人烂炒。
但是当模型识别到这是一个SVG任务,思维链就会立刻转向与本身皆然相反的Gemini思维链。且在思维链中,Gemini式思考和3.2 speciale式思考互殴严重。这就导致了出来的东西四不像,能同时感觉的Gemini的风格和v4l的区。
目前可以断定,这个能力几乎不可能带到正式版中,除了这个明目张胆蒸有点洗不干净,在为数不多的后训练时间里,应该还要调控各种各样的思维链样式
--【壹】--:
0330测试了一下,变回以前了
--【贰】--:
除了or的图标不太像以外剩下的不错啊
--【叁】--:
集百家之()
--【肆】--:
看来不能指望deepseek新版能有多少性能提升了
--【伍】--:
现在3.1p唯一的作用就是给我的项目生成一些SVG,不得不说复制的确实很好
--【陆】--:
不会是每一家都蒸馏,然后发三个模型吧
--【柒】--:
不必去猜,来了再说
--【捌】--:
这个我记得有个网站里面有现成的SVG,png等的图标
--【玖】--:
icon 都用SVG 画,就没版权了
--【拾】--:
说人话,审美好,编程强不可兼得吗
--【拾壹】--:
所以SVG除了烂炒以外有什么用呢)
--【拾贰】--:
补充
image328×135 6.61 KB
那就没问题了,
固定指令:SVG
parttern:Gemini思维链
--【拾叁】--:
御三家的能力聚集在一起吗,gemini的svg,oai的不说人话(已经优化),claude的编程

