DS v4 强在哪里?

2026-04-29 08:082阅读0评论SEO教程
  • 内容介绍
  • 文章标签
  • 相关推荐
问题描述:

V3.2 时代我就对 DS 有偏见。原因非常的直观:听不懂人话,在理解隐含意图的层面上连 qwen 3.5 都打不过。

结果 V4 时代仍然不能很好的听懂人话,作为 T 级参数量的模型,结果连降智降成傻子的 Gemini 3 flash 都不如。

包括做题能力。V4 pro 的做题能力感觉并不理想,CF 3200 是肯定没有的。做一些相对简单的题都感觉完全不得要领,思维链绕来绕去。Gemini 3.1 Pro 的表现就好很多。

仍然不支持多模态。

以上是一些吐槽。事实上,在 V4 发布之前,我也很有期待。但是实际上手之后感觉失望了。我相信这是我的使用场景和 DS 的能力方向不重叠带来的。所以,诸位,请问 DS V4 的强大到底体现在哪里呢?

网友解答:
--【壹】--:

这也是我的疑惑,我这两天在CC里用V4P MAX,但发现指令遵循很差,而且经常上一个指令发出没超过两句对话就不管我了。我多次强调先回复我分析结论和方案,确认后再写代码,但很多次就是猛猛开干,我都不确定是CC的问题还是模型的问题。


--【贰】--:

确实,比人味流失的 Gemini 3 flash 更强的多。


--【叁】--:

我不好评价,上面的帖子怎么被删了。这样的言论算是涉及到了人身攻击从而不友善吗,那么就删除吧。


--【肆】--: 途川:

理解隐含意图的层面上

我觉得理解隐含意图的层面上并没什么大的进步,这种理解能力我感觉gemini 3.1 pro是最好的


--【伍】--:

没必要带有偏见

dsv4很强,只不过并不是全面的强

强的地方,很多人都说过了

这个价格,真要是全面的强,怕是对面的几家第二天就要倒闭。。。


--【陆】--:

是的。Gemini 3 全系都是谜语人大师。flash、Pro,3.1 Pro 逐层变强。


--【柒】--:

代码能力还不错,我唯一的使用场景就是这个。用起来和gpt-5.3-codex差别不大。
编排4 + subagent毫不费力,也不会像kimi-k2.6和glm5.1一样思维链长到天上
找bug和review能力都不错,而且相比于gpt说人话的能力高多了
可用的1m上下文+便宜缓存,非常适合处理复杂项目
最后,v4的性能建立在api + max思考强度上。

我没有必要为了情怀而忍受任何难用的东西

事实是任何模型都有自己的甜区和弱点,比如Gemini写代码就纯流口水。用模型只考虑价格和能力,用不用是完全是自己的决定嘛,说的好像别人用deep seek是为了情怀一样


--【捌】--:

难道,我没有看思维链吗?

拿我的这篇博文去问 DS,然后再换 Gemini 3.1 Pro 试试。

正确即是废话,废话亦是正确 – 26 Apr 26

Counting Perfect Permutations

西电校赛遇到的神秘题目。 题目 称长度为 $n$ 的排列 $p$ 是完美的,当且仅当对于任意 $1 \leq i < j \leq n$,$p_i \perp p_j$ 当且仅当 $i \perp j$(这里的垂直符号代表互素)。 给定正整数 $n$ 满足 $n \leq 10^6$,请求出长度为 $n$ 的完美的排列的总数,对 $10^9+7$ 取模。 初步思考 注意到恒等排列 $p_i \equiv i$ 一定合法。 考虑用交换构造出所有排列。什么交换是不合法的呢? 对于两个位置 $i,...

这就是我今天和 DS 的互动。


--【玖】--:

建议是不好用就暂时不要用了,你可以用别的你认为好的模型,但请不要有偏见。
deepseek在这样的价格下我自认为我已经得到了足够好的性能。
抛开价格谈价值就是耍流氓。


--【拾】--:

对我觉得这就够了,以前也就是聊天用,编码的以后便宜的话作为一个打下手的模型很不错。


--【拾壹】--:

强在价格,
强在这个价格支持1M(真实)上下文,有些标1M超过200k你看它流口水
强在没有限速排队限流,
强在可部署在国产集群推理,甚至训练。
强在性能我用起来连 deepseek-v4-flash 都能完美对接 hermes/openclaw。
强在我用起来感觉比sonnet-4.6更强,我需求就是这水平足够了。
(之前用L站佬友开源 cursor2api 狠蹬了大半个月,
完全满足我所有需求,即使当时的sonnet-4.6还是残次版本各种提醒cursor文档工具错误。)
强在Deepseek V4出来之前,我发了起码3个贴在L站问,到底有什么可以爽蹬的模型官方渠道,实在找不到。glm-5.1够用但是各种限速排队改套餐、A/ 和 gpt各种封号掉渠道、mimimaxi和grok路边一、qwen3.6和kimi2.5我觉得强差人意,kimi-2.6刚出来好像还行,马上就跟glm坐一桌。
现在D佬出来了,爽用够用随便用,没限速速度快,就算flash都很好用。

image1071×889 38.8 KB

重点:

强在大陆信用卡可支付
强在我是土生土长老中人,他没歧视我,还给我打25折。
你告诉我,哪个体面人能长期忍受这样:
image559×371 57.9 KB
image616×293 35.1 KB

结论:

真需要cluade-opus-4.6-max / gpt-5.5-xhigh的人确实是付费大头人群,
但他们在人类之中不足0.1%,我说的。
90% 普通人,web免费版都够用了。
9.9% 爱好者,一个月100-200RMB我觉得在老中,已经算是高强度使用。
再说了调用api的群体,都不一定有科学上网的人多。

我从来不看什么排名、评分,我自己用,
只要能解决手头上的事,这个AI对我就是"一勃分"。
一天到晚让你找外网纯净IP,手机卡,银行卡折腾的,我不如不用了。
这AI提高的性能5% 10%的,都不够我折腾的


我们交给时间吧!再过一年半载,
本地部署的27b-35b之类的,
估计就有sonnet-4.6水平了。
A/ 你好S!


--【拾贰】--:

用来聊天无敌,人味很足,不会无脑夸,也不会无脑踩,边界控制得很好


--【拾叁】--:

长上下文很强,聊天能说人话

用在现有的项目里很好用,它能读到足够多的现有项目的上下文,然后能跟你充分的沟通

但是,没有上下文的时候,尤其是从0开始写代码的时候不如别家的


--【拾肆】--:

还没用它来coding,不过在我的场景测试下也是没有什么很厉害的;但是我感觉他聊天好用了很多很多,还有就是文科类的东西我觉得可以平替国外模型了


--【拾伍】--:

目前来看,实打实的优点只有便宜,其他方面都挺一般


--【拾陆】--:

有些事情心里明白,说出来的话,很尴尬的。


--【拾柒】--:

我觉得这个价格摆在这里,如果一下子达到国外顶尖闭源模型的效果那论坛都要炸了,应付日常小任务绰绰有余


--【拾捌】--:

我觉得FLASH做翻译不错,PRO暂时未达到我生产环境的使用要求


--【拾玖】--:

首先 你可以去网页版本看看他的思维链路
比之前强的不是一星半点
然后 你可以去网上看看评测 大家说的例子 你实际看看,进步还是有的
每个人的测试方案不一样,也许你要的 这一代没有给你
最后 再报有点希望吧 因为这个预览版 因为这是性价比最高的 因为这是国产化的
你可以觉得不好,但是请先容忍一下它