DeepSeek V4 Pro代码测评:抱歉没能让GLM大人尽兴
- 内容介绍
- 文章标签
- 相关推荐
依旧先放私有bench
image953×431 9.59 KB
这个模型吧,他的思考效率极低,,经常思考个600-1000秒
但是呢,人家GPT思考这么久真能把活干好,v4p就只能达到中游水平了
image1296×792 113 KB
写出来的很多东西只能说想法很好,但能力不足
image1206×800 136 KB
image860×801 103 KB
在审美这一块呢,不像任何一个模型,基本都有自己的理解,说明代码蒸的不多,不像某些没能尽兴的模型
image1205×801 48.5 KB
不过在知识库上确实是Gemini之下差不多最强的了
image509×413 20.7 KB
当前价格是12/24,OR折算美元1.74/3.48,对比GLM 5.1还是贵了不少的
只能希望公告里所谓的下半年国产算力之后能有大幅降价吧
image1854×511 102 KB
--【壹】--:
还真是,我从 GLM 4.5 开始,就拿它来写东西了
--【贰】--:
佬友这个私有Bench的3.1Pro明显高了,其实我觉得你这个榜也和实际Coding体感差不多,也可以看看nao佬的评测 DeepseekV4Pro的私有Coding测试集评测结果(对比GLM5.1) - 前沿快讯 - LINUX DO
--【叁】--:
佬友会不会测评一下5.5啊,看它在佬友的私有bench里到底怎么样
--【肆】--:
编码还是建议Claude和GPT,Deepseek我觉得能够在知识量和文本对话中跟Gemini拼一拼,同时有更好的上下文注意力和Agent工具能力就很不错了,这是一个很好的起点了,各家国模应该也能从Deepseek的基础上再推进
--【伍】--:
昨天下午开始就感觉速度明显变快了,(deepseek-chat),基本上秒出,比原来好就行。
依旧先放私有bench
image953×431 9.59 KB
这个模型吧,他的思考效率极低,,经常思考个600-1000秒
但是呢,人家GPT思考这么久真能把活干好,v4p就只能达到中游水平了
image1296×792 113 KB
写出来的很多东西只能说想法很好,但能力不足
image1206×800 136 KB
image860×801 103 KB
在审美这一块呢,不像任何一个模型,基本都有自己的理解,说明代码蒸的不多,不像某些没能尽兴的模型
image1205×801 48.5 KB
不过在知识库上确实是Gemini之下差不多最强的了
image509×413 20.7 KB
当前价格是12/24,OR折算美元1.74/3.48,对比GLM 5.1还是贵了不少的
只能希望公告里所谓的下半年国产算力之后能有大幅降价吧
image1854×511 102 KB
--【壹】--:
还真是,我从 GLM 4.5 开始,就拿它来写东西了
--【贰】--:
佬友这个私有Bench的3.1Pro明显高了,其实我觉得你这个榜也和实际Coding体感差不多,也可以看看nao佬的评测 DeepseekV4Pro的私有Coding测试集评测结果(对比GLM5.1) - 前沿快讯 - LINUX DO
--【叁】--:
佬友会不会测评一下5.5啊,看它在佬友的私有bench里到底怎么样
--【肆】--:
编码还是建议Claude和GPT,Deepseek我觉得能够在知识量和文本对话中跟Gemini拼一拼,同时有更好的上下文注意力和Agent工具能力就很不错了,这是一个很好的起点了,各家国模应该也能从Deepseek的基础上再推进
--【伍】--:
昨天下午开始就感觉速度明显变快了,(deepseek-chat),基本上秒出,比原来好就行。

