DeepSeek V4 在面对无答案的开放问题上表现依然让人力竭,以及一些碎碎念和暴论

2026-04-29 10:051阅读0评论SEO资讯
  • 内容介绍
  • 文章标签
  • 相关推荐
问题描述:

在面对没有正确答案、需要推理、存在需要模型主动思考,用户问题没有明面上指出的边缘条件的开放性问题时,DS的表现和之前的几个版本一样,依然处于完全无法使用的程度。
具体来说我拿一个和opus4.6讨论的问题重新问了一遍DS,opus是一轮过的,之后我就开始聊更深入的东西了,而和DS我反反复复纠正了7轮,花掉了整整1块,问题还没解决。此时我已经心累了,根本不准备继续聊下去了。

虽然很想直接发截图的,但发出来估计我这号就能直接没了,所以简单描述一下吧。
我经常和AI聊的问题大多有这些特点:

  1. 问题在回答前有很多约束条件,这些约束条件甚至可能与世界知识相悖,需要模型有极强的指令遵循能力;
  2. 分析问题时需要考虑的条件/方向/因素很多,甚至约束条件/参考内容可能出现在所有的对话记录里的任意位置且没有明确提示;
  3. 模型回答问题需要分析的内容在用户提问的明面上完全看不出来。用户提问的是A,但需要回答这个问题A模型必须思考BCDEFG的内容,因为A牵扯到了这些方面。;
  4. 在分析A的时候,会推导出B,但由B可得A不成立。opus这时就会发现A这个观点是错的,并否定掉。而DS在分析出B之后就没下文了。思考深度太浅。
  5. 用户因为各种原因不能或不想把问题问得太直白或话说太死,比如用户自己也不知道答案或回答方向,用户不希望把所有例子都举出来免得模型不举一反三,等等。这时候就需要模型主动理解用户意图并探索问题里不存在的边缘条件/因素。

以上要求在我目前使用各家模型之后,发现只有opus4.5及之后的模型可以做到,其他所有模型都做不到。
甚至我还有一个很暴论的猜想:是不是MoE模型先天缺陷就是这个?MoE模型没办法正确激活用户需要的所有专家,所以总是会出现想的不全或按字面意思回答的情况。
而claude是稠密模型,所以才能做到举一反三,主动思考各种边缘条件。
而且DS即使开了max思考也只思考20秒左右,opus基本都是思考50-80秒左右(反代),满血的都是百秒甚至200秒起步。

阅读全文
问题描述:

在面对没有正确答案、需要推理、存在需要模型主动思考,用户问题没有明面上指出的边缘条件的开放性问题时,DS的表现和之前的几个版本一样,依然处于完全无法使用的程度。
具体来说我拿一个和opus4.6讨论的问题重新问了一遍DS,opus是一轮过的,之后我就开始聊更深入的东西了,而和DS我反反复复纠正了7轮,花掉了整整1块,问题还没解决。此时我已经心累了,根本不准备继续聊下去了。

虽然很想直接发截图的,但发出来估计我这号就能直接没了,所以简单描述一下吧。
我经常和AI聊的问题大多有这些特点:

  1. 问题在回答前有很多约束条件,这些约束条件甚至可能与世界知识相悖,需要模型有极强的指令遵循能力;
  2. 分析问题时需要考虑的条件/方向/因素很多,甚至约束条件/参考内容可能出现在所有的对话记录里的任意位置且没有明确提示;
  3. 模型回答问题需要分析的内容在用户提问的明面上完全看不出来。用户提问的是A,但需要回答这个问题A模型必须思考BCDEFG的内容,因为A牵扯到了这些方面。;
  4. 在分析A的时候,会推导出B,但由B可得A不成立。opus这时就会发现A这个观点是错的,并否定掉。而DS在分析出B之后就没下文了。思考深度太浅。
  5. 用户因为各种原因不能或不想把问题问得太直白或话说太死,比如用户自己也不知道答案或回答方向,用户不希望把所有例子都举出来免得模型不举一反三,等等。这时候就需要模型主动理解用户意图并探索问题里不存在的边缘条件/因素。

以上要求在我目前使用各家模型之后,发现只有opus4.5及之后的模型可以做到,其他所有模型都做不到。
甚至我还有一个很暴论的猜想:是不是MoE模型先天缺陷就是这个?MoE模型没办法正确激活用户需要的所有专家,所以总是会出现想的不全或按字面意思回答的情况。
而claude是稠密模型,所以才能做到举一反三,主动思考各种边缘条件。
而且DS即使开了max思考也只思考20秒左右,opus基本都是思考50-80秒左右(反代),满血的都是百秒甚至200秒起步。

阅读全文