关于DeepSeek-V4的Coding评测配置(附官方benchmark合并版)
- 内容介绍
- 文章标签
- 相关推荐
看各位佬都在测,但是似乎效果没有很好,提醒一下大家配置:
export ANTHROPIC_MODEL=deepseek-v4-pro
export ANTHROPIC_DEFAULT_OPUS_MODEL=deepseek-v4-pro[1m]
export ANTHROPIC_DEFAULT_SONNET_MODEL=deepseek-v4-pro
export ANTHROPIC_DEFAULT_HAIKU_MODEL=deepseek-v4-pro
export CLAUDE_CODE_SUBAGENT_MODEL=deepseek-v4-pro
export CLAUDE_CODE_DISABLE_NONESSENTIAL_TRAFFIC=1
export CLAUDE_CODE_DISABLE_NONSTREAMING_FALLBACK=1
export CLAUDE_CODE_EFFORT_LEVEL=max
最重要的,一定要开max, 否则能力基本上也就和glm差不多
此外subagent的模型也要配成deepseek-v4-pro
怎么就有杠精只会看公众号不会看看官方开源的readme怎么写的呢?我放一下合并表格好了:
image1451×1195 205 KB
image690×985 93.6 KB
image596×321 18 KB
另外我说不开max能力和glm差不多,不会也要杠吧:
image708×1063 115 KB
image481×271 14.5 KB
这是high不是max哦
网友解答:--【壹】--:
众所周知。。4.7不太行,比4.6还是差点,4.7嘛。。。
--【贰】--:
如果有官方的 Coding Plan 就好了。
--【叁】--: 空亦空:
比不上4.7
4.7实际体感不如4.5 4.6 opus,没毛病
--【肆】--:
MAX我认为是夯爆了,比背刺王的GLM5.1强
--【伍】--:
官方不是说比4.5强,但比不过4.6思考模式吗?你怎么到你这就变成没4.5强了
--【陆】--:
API怎么开启MAX版本 ,怎么开启。。
--【柒】--:
目前的价格是挺夯爆了 ,让改一个需求花了10块钱。(一次改过
--【捌】--:
codex怎么开max思考,开xhigh吗,有没有佬试过
--【玖】--:
你们都在哪用的,有什么好用的cili终端吗
--【拾】--:
啊 真有这么强嘛 官方不是说比4.5 opus 有一定差距嘛 应该比不上4.7吧
--【拾壹】--:
原来如此,我都没开1m和max,这下学到了,谢谢佬
--【拾贰】--:
试了下,skill调用上效果比较差,不太舒服
--【拾叁】--:
Deepseek-4-pro-max的评价为夯
--【拾肆】--:
4.7不太行 比4.6差点 比4.7强 xD 闭环了
--【拾伍】--:
能赶上glm5.1的指令遵循水平就很不错了,不知道佬实测下来如何(这里踩一下qwen 3.6 非常不行)
--【拾陆】--:
语言的艺术,习惯就好了,这不是deepseek的基本操作吗?
--【拾柒】--:
我在论文中也发现了promax,实际上应该就是把推理等级拉满
image1766×798 122 KB
--【拾捌】--:
直接平替opus,反正体感上比opus-4.7强
--【拾玖】--:
promax怎么开启?直接把思考参数调到最高吗?
看各位佬都在测,但是似乎效果没有很好,提醒一下大家配置:
export ANTHROPIC_MODEL=deepseek-v4-pro
export ANTHROPIC_DEFAULT_OPUS_MODEL=deepseek-v4-pro[1m]
export ANTHROPIC_DEFAULT_SONNET_MODEL=deepseek-v4-pro
export ANTHROPIC_DEFAULT_HAIKU_MODEL=deepseek-v4-pro
export CLAUDE_CODE_SUBAGENT_MODEL=deepseek-v4-pro
export CLAUDE_CODE_DISABLE_NONESSENTIAL_TRAFFIC=1
export CLAUDE_CODE_DISABLE_NONSTREAMING_FALLBACK=1
export CLAUDE_CODE_EFFORT_LEVEL=max
最重要的,一定要开max, 否则能力基本上也就和glm差不多
此外subagent的模型也要配成deepseek-v4-pro
怎么就有杠精只会看公众号不会看看官方开源的readme怎么写的呢?我放一下合并表格好了:
image1451×1195 205 KB
image690×985 93.6 KB
image596×321 18 KB
另外我说不开max能力和glm差不多,不会也要杠吧:
image708×1063 115 KB
image481×271 14.5 KB
这是high不是max哦
网友解答:--【壹】--:
众所周知。。4.7不太行,比4.6还是差点,4.7嘛。。。
--【贰】--:
如果有官方的 Coding Plan 就好了。
--【叁】--: 空亦空:
比不上4.7
4.7实际体感不如4.5 4.6 opus,没毛病
--【肆】--:
MAX我认为是夯爆了,比背刺王的GLM5.1强
--【伍】--:
官方不是说比4.5强,但比不过4.6思考模式吗?你怎么到你这就变成没4.5强了
--【陆】--:
API怎么开启MAX版本 ,怎么开启。。
--【柒】--:
目前的价格是挺夯爆了 ,让改一个需求花了10块钱。(一次改过
--【捌】--:
codex怎么开max思考,开xhigh吗,有没有佬试过
--【玖】--:
你们都在哪用的,有什么好用的cili终端吗
--【拾】--:
啊 真有这么强嘛 官方不是说比4.5 opus 有一定差距嘛 应该比不上4.7吧
--【拾壹】--:
原来如此,我都没开1m和max,这下学到了,谢谢佬
--【拾贰】--:
试了下,skill调用上效果比较差,不太舒服
--【拾叁】--:
Deepseek-4-pro-max的评价为夯
--【拾肆】--:
4.7不太行 比4.6差点 比4.7强 xD 闭环了
--【拾伍】--:
能赶上glm5.1的指令遵循水平就很不错了,不知道佬实测下来如何(这里踩一下qwen 3.6 非常不行)
--【拾陆】--:
语言的艺术,习惯就好了,这不是deepseek的基本操作吗?
--【拾柒】--:
我在论文中也发现了promax,实际上应该就是把推理等级拉满
image1766×798 122 KB
--【拾捌】--:
直接平替opus,反正体感上比opus-4.7强
--【拾玖】--:
promax怎么开启?直接把思考参数调到最高吗?

