如果不是A不做人加上opus 4.7拉跨,我也不会吹爆Deepseek Pro(max)

2026-04-29 09:332阅读0评论SEO教程
  • 内容介绍
  • 文章标签
  • 相关推荐
问题描述:

TLDR: 写代码-拉,读代码—夯爆了

在吹DeepSeek之前,先说下A\为啥不做人:

  1. B端客户当爸爸,C端客户当儿子
  2. 小动作特别多(偷偷降智这种事就不提了)
  3. 又当又立(很多做法当成商业行为可以理解,价格高不是它的问题,是我的问题。但coding plan本身就是亏本买卖,现在既要月活,又把低质量客户当狗看)
  4. Opus 4.7(xhigh)目前极度偷懒,不愿意看更多context。虽然看过的问题答案都差不多,但在复杂代码库里漏掉context是非常严重的问题

刚订阅了opencode-go,用omo试了下DeepSeek Pro(Max),说说原子弹爆炸的地方:

  1. Attention! Attention! Attention! 上下文飙到400k不带忘的,这种体验我只在Opus 4.5、4.6和GPT系列上体会过
    attention体验排名:Opus 4.6/4.5 > GPT > DS V4 Pro(Max) >> Opus 4.7 > Gemini in Antigravity >>> 国产模型(GLM 5.1、Kimi 2.6等)
    2.干活很积极,deeply seek的欲望很强,能跟GPT 5.5(xhigh)给出的plan进行两轮讨论(其他国产模型经常直接all pass,Opus差不多也能撑1~2轮)
    3.速度很快,opencode部署能飙到40~50 TPS

暂时想到的主要就这三点,但我还是不建议all in DeepSeek,目前定位只能当个下位GPT替代。

吹完就该黑一下:
1.难题太慢了。虽然DS能解决其他国产模型搞不定的问题,但感觉像在手动推导,而Opus和GPT像是语料库里喂过答案,很快就定位到问题。DS的DeepSeek模式太吓人了,一个很隐蔽的bug不停推导干了我50%的周额度
2. 模型调用tools/subagents不积极,喜欢自己闷头干。这应该是post training的问题,后续应该能解决
3. 写代码还是拉胯,生产还是得靠GPT。试过一次,写完还有3、4个bugs

网友解答:
--【壹】--:

果然有大量实际测试经历支撑就是不一样,感谢佬的分享,很有参考意义。请问佬使用下来,哪家cli使用上最好?有人说claude code的架构做得好,都是后面接其他模型来用,而不是直接用codex cli


--【贰】--:

没事,Deepseek开源之后,马上他们就会跟上来的。


--【叁】--:

OMG,是Opus 4.7大人!!!

喜欢我GPT一样的词汇,类人十足的交互,超强(大嘘)上下文,高价然后Tokenizer还拉跨,公司还往死里封号吗?


--【肆】--:

纯看个人习惯了,我习惯CODEX CLI,各家功能都差不多,有的人喜欢CC那就用CC,这个没什么,完全你自己,我的话只能代表我个人,并不能代表你喜欢不喜欢,至于产出结果和我们的持续工作流都是基于CODEX CLI的,没有基于CC核心原因是CC过于不稳定了,版本迭代太快导致功能差距较大,变量可控下差,这对于连续工作是个弊端。


--【伍】--:

跳蚤市场反重力企业订阅呀。。40~100多不等吧。我是七八个pro轮询。也还好。规划都不用opus,gpt+superpower 规划的很好


--【陆】--:

狗屎一样的OPUS4.7,真的狗都不用,我同事下个月可能也不订了,人家发现DeepSeek写前端还能用,不丑,虽然也谈不上GEMINI那么惊艳,和OPUS是有来有回的,就是贵,但是我们报销,哈哈哈哈


--【柒】--:

我昨天测试几个比较复杂的开发任务 认真说毫无变化,还是找不到点上,而且蠢得一批,我感觉你用4.7都不如回去用4.6,不过OPUS真的难用要死,像我们这种全额报销的公司没什么顾虑的,压根都不会选他


--【捌】--:

那确实,咱们只要混合一下成本还是能降一降的,GEMINI写前端的确强,这个有一说一,但是上下文也的确拉,OPUS,真没觉得用它的必要


--【玖】--:

可以了我觉得。站里买个企业订阅拼车40 。 ds写完让哈基米在优化一下。我就是这样写的react。、 opus? 死!!!


--【拾】--:

前几天v4flash灰测api的时候我在claudecode 里用了一会,工具调用比any的opus还积极,很有gpt的感觉,opus有着现成的acetool和fastcontext哪怕claude.md里写了也还是不用,gpt和v4flash则是查代码就会用。opencode里不用工具可能是没适配opencode


--【拾壹】--:

Opus 4.7 喜欢偷懒,看漏上下文这个毛病太致命了


--【拾贰】--:

opencode go吗大佬。40是人民币还是美金呀 没有gpt之类的模型吗


--【拾叁】--:

那确实,毕竟用在工程上的少,TOKENS太值钱了,还有主要是能在实际工程上能无限制、不计成本测试的企业极少,我司这种认真说,你全行业都不找出第二家,一个老板愿意给一年上百万预算让你测试各家AI(国内外),然后选出最适合开发的和WORKFLOW的AI模型,这就很少见了,还愿意让我们不计成本的测试整套持续工作流,甚至拖慢项目进度,很难。

我们是真真的砸了上百万RMB测试出来的,就这个钱我们可以部署一套A100集群了,早期给A\贡献都大几十万了,所以为什么我说OPUS我觉得狗屎一样的,我们是真金白银砸出来的测试,不是那种人云亦云的测试。

垃圾不垃圾我们测试过,自然知道好不好用,尤其最近几代OPUS,抛开某些人的皈依者狂热思维,理性看,真的难用,降智的很厉害,不管思考性还是非思。


--【拾肆】--:

我们自己的WORKFLOW用的是GPT做的规划,没感觉很差,OPUS我也没感觉到多强,这个实际上一直是在说,没什么实际的内容贴出来对比过,我司的持续工作流实践没有用过OPUS,只有前端的两位香港同事喜欢用CC所以订阅了MAX(自费),而且我发现一件事,OPUS的规划PLAN能省则省(前端同事的PLAN模式),而GPT-5.4的PLAN.MD会非常详尽,然后根据PLAN.MD做修改的话也会非常详细,不太理解这里边强,强在哪里,如果PLAN本身不够详尽那怎么能确定让AI的执行方向准确呢?这不就是悖论么?

当然我这个对比也不权威,前端同事的PLAN属于简单的几项功能,而GPT属于复杂功能,差距还是有的,但是能看得出来有明显不同


--【拾伍】--: 就是玩:

DeepSeek Pro(Max)

是在官网预定吗?我在官网好像没看到。他们有套餐吗?


--【拾陆】--:

请问佬现在opus 4.6智力恢复了吗?由于担心一直捏着鼻子用4.7


--【拾柒】--:

好的,多谢佬的解答!看来还是要在实践中进行测试


--【拾捌】--:

试了 flash版本的api… 厉害的 1块钱 干opus100块的事儿..


--【拾玖】--:

我之前发的话题讨论过这个问题:

https://linux.do/t/topic/2040694

里面其他佬说opus目前做plan的规划能力还是比较强,实际执行不太行。请问佬怎么看?

标签:人工智能
问题描述:

TLDR: 写代码-拉,读代码—夯爆了

在吹DeepSeek之前,先说下A\为啥不做人:

  1. B端客户当爸爸,C端客户当儿子
  2. 小动作特别多(偷偷降智这种事就不提了)
  3. 又当又立(很多做法当成商业行为可以理解,价格高不是它的问题,是我的问题。但coding plan本身就是亏本买卖,现在既要月活,又把低质量客户当狗看)
  4. Opus 4.7(xhigh)目前极度偷懒,不愿意看更多context。虽然看过的问题答案都差不多,但在复杂代码库里漏掉context是非常严重的问题

刚订阅了opencode-go,用omo试了下DeepSeek Pro(Max),说说原子弹爆炸的地方:

  1. Attention! Attention! Attention! 上下文飙到400k不带忘的,这种体验我只在Opus 4.5、4.6和GPT系列上体会过
    attention体验排名:Opus 4.6/4.5 > GPT > DS V4 Pro(Max) >> Opus 4.7 > Gemini in Antigravity >>> 国产模型(GLM 5.1、Kimi 2.6等)
    2.干活很积极,deeply seek的欲望很强,能跟GPT 5.5(xhigh)给出的plan进行两轮讨论(其他国产模型经常直接all pass,Opus差不多也能撑1~2轮)
    3.速度很快,opencode部署能飙到40~50 TPS

暂时想到的主要就这三点,但我还是不建议all in DeepSeek,目前定位只能当个下位GPT替代。

吹完就该黑一下:
1.难题太慢了。虽然DS能解决其他国产模型搞不定的问题,但感觉像在手动推导,而Opus和GPT像是语料库里喂过答案,很快就定位到问题。DS的DeepSeek模式太吓人了,一个很隐蔽的bug不停推导干了我50%的周额度
2. 模型调用tools/subagents不积极,喜欢自己闷头干。这应该是post training的问题,后续应该能解决
3. 写代码还是拉胯,生产还是得靠GPT。试过一次,写完还有3、4个bugs

网友解答:
--【壹】--:

果然有大量实际测试经历支撑就是不一样,感谢佬的分享,很有参考意义。请问佬使用下来,哪家cli使用上最好?有人说claude code的架构做得好,都是后面接其他模型来用,而不是直接用codex cli


--【贰】--:

没事,Deepseek开源之后,马上他们就会跟上来的。


--【叁】--:

OMG,是Opus 4.7大人!!!

喜欢我GPT一样的词汇,类人十足的交互,超强(大嘘)上下文,高价然后Tokenizer还拉跨,公司还往死里封号吗?


--【肆】--:

纯看个人习惯了,我习惯CODEX CLI,各家功能都差不多,有的人喜欢CC那就用CC,这个没什么,完全你自己,我的话只能代表我个人,并不能代表你喜欢不喜欢,至于产出结果和我们的持续工作流都是基于CODEX CLI的,没有基于CC核心原因是CC过于不稳定了,版本迭代太快导致功能差距较大,变量可控下差,这对于连续工作是个弊端。


--【伍】--:

跳蚤市场反重力企业订阅呀。。40~100多不等吧。我是七八个pro轮询。也还好。规划都不用opus,gpt+superpower 规划的很好


--【陆】--:

狗屎一样的OPUS4.7,真的狗都不用,我同事下个月可能也不订了,人家发现DeepSeek写前端还能用,不丑,虽然也谈不上GEMINI那么惊艳,和OPUS是有来有回的,就是贵,但是我们报销,哈哈哈哈


--【柒】--:

我昨天测试几个比较复杂的开发任务 认真说毫无变化,还是找不到点上,而且蠢得一批,我感觉你用4.7都不如回去用4.6,不过OPUS真的难用要死,像我们这种全额报销的公司没什么顾虑的,压根都不会选他


--【捌】--:

那确实,咱们只要混合一下成本还是能降一降的,GEMINI写前端的确强,这个有一说一,但是上下文也的确拉,OPUS,真没觉得用它的必要


--【玖】--:

可以了我觉得。站里买个企业订阅拼车40 。 ds写完让哈基米在优化一下。我就是这样写的react。、 opus? 死!!!


--【拾】--:

前几天v4flash灰测api的时候我在claudecode 里用了一会,工具调用比any的opus还积极,很有gpt的感觉,opus有着现成的acetool和fastcontext哪怕claude.md里写了也还是不用,gpt和v4flash则是查代码就会用。opencode里不用工具可能是没适配opencode


--【拾壹】--:

Opus 4.7 喜欢偷懒,看漏上下文这个毛病太致命了


--【拾贰】--:

opencode go吗大佬。40是人民币还是美金呀 没有gpt之类的模型吗


--【拾叁】--:

那确实,毕竟用在工程上的少,TOKENS太值钱了,还有主要是能在实际工程上能无限制、不计成本测试的企业极少,我司这种认真说,你全行业都不找出第二家,一个老板愿意给一年上百万预算让你测试各家AI(国内外),然后选出最适合开发的和WORKFLOW的AI模型,这就很少见了,还愿意让我们不计成本的测试整套持续工作流,甚至拖慢项目进度,很难。

我们是真真的砸了上百万RMB测试出来的,就这个钱我们可以部署一套A100集群了,早期给A\贡献都大几十万了,所以为什么我说OPUS我觉得狗屎一样的,我们是真金白银砸出来的测试,不是那种人云亦云的测试。

垃圾不垃圾我们测试过,自然知道好不好用,尤其最近几代OPUS,抛开某些人的皈依者狂热思维,理性看,真的难用,降智的很厉害,不管思考性还是非思。


--【拾肆】--:

我们自己的WORKFLOW用的是GPT做的规划,没感觉很差,OPUS我也没感觉到多强,这个实际上一直是在说,没什么实际的内容贴出来对比过,我司的持续工作流实践没有用过OPUS,只有前端的两位香港同事喜欢用CC所以订阅了MAX(自费),而且我发现一件事,OPUS的规划PLAN能省则省(前端同事的PLAN模式),而GPT-5.4的PLAN.MD会非常详尽,然后根据PLAN.MD做修改的话也会非常详细,不太理解这里边强,强在哪里,如果PLAN本身不够详尽那怎么能确定让AI的执行方向准确呢?这不就是悖论么?

当然我这个对比也不权威,前端同事的PLAN属于简单的几项功能,而GPT属于复杂功能,差距还是有的,但是能看得出来有明显不同


--【拾伍】--: 就是玩:

DeepSeek Pro(Max)

是在官网预定吗?我在官网好像没看到。他们有套餐吗?


--【拾陆】--:

请问佬现在opus 4.6智力恢复了吗?由于担心一直捏着鼻子用4.7


--【拾柒】--:

好的,多谢佬的解答!看来还是要在实践中进行测试


--【拾捌】--:

试了 flash版本的api… 厉害的 1块钱 干opus100块的事儿..


--【拾玖】--:

我之前发的话题讨论过这个问题:

https://linux.do/t/topic/2040694

里面其他佬说opus目前做plan的规划能力还是比较强,实际执行不太行。请问佬怎么看?

标签:人工智能