纠正一下大家关于DeepSeek V4的(疑似)误区

2026-04-29 10:341阅读0评论SEO资源
  • 内容介绍
  • 文章标签
  • 相关推荐
问题描述:

疑似:
训练使用的还是NVIDIA的显卡,推理使用的是华为的
这也是一个很大的进步了,但是大家不要混淆)刚还看到ds4暴打英伟达的帖子

网友解答:
--【壹】--:

不清楚,细节等晚上听听昇腾的直播吧,没信源的话先不评价两种说法


--【贰】--:

训练还是挺重要的,现在国产卡集群规模很难在训练任务上有效 scale 上去。之前只听说过千卡规模的国产卡集群成功训练了小参数量的大语言模型和文生图模型。万卡规模的训练还没有听说,仅有一些头部厂商实现了万卡集群的推理。


--【叁】--: Eric:

刚还看到ds4暴打英伟达的帖子

思维能力正常的人
应该都不会说出这种话吧
要么是串子,要么就是营销号看多了纯跟风


--【肆】--:

信源是哪里?deepseek model card里面有披露么


--【伍】--:

训练据说也用了昇腾了
如果你辟谣也得给个信源吧


--【陆】--:

从之前 DS 开源的算子实现和现在的技术报告看,训练部分大概率还是 NVIDIA 为主力:

图片1678×1487 499 KB

只不过确实部分关键算子比如 MegaMoE 这些适配了 Ascend NPU,还有一部分算子使用 TileLang 实现,应该也适配了 Ascend NPU:

图片1593×538 92.9 KB

图片1709×1245 208 KB


--【柒】--:

之前的V3也能用昇腾推理呀,如果单纯只是用昇腾推理,感觉没什么奇特的呢


--【捌】--:

训练用谁没那么重要

推理成本才是落地的大头

问题描述:

疑似:
训练使用的还是NVIDIA的显卡,推理使用的是华为的
这也是一个很大的进步了,但是大家不要混淆)刚还看到ds4暴打英伟达的帖子

网友解答:
--【壹】--:

不清楚,细节等晚上听听昇腾的直播吧,没信源的话先不评价两种说法


--【贰】--:

训练还是挺重要的,现在国产卡集群规模很难在训练任务上有效 scale 上去。之前只听说过千卡规模的国产卡集群成功训练了小参数量的大语言模型和文生图模型。万卡规模的训练还没有听说,仅有一些头部厂商实现了万卡集群的推理。


--【叁】--: Eric:

刚还看到ds4暴打英伟达的帖子

思维能力正常的人
应该都不会说出这种话吧
要么是串子,要么就是营销号看多了纯跟风


--【肆】--:

信源是哪里?deepseek model card里面有披露么


--【伍】--:

训练据说也用了昇腾了
如果你辟谣也得给个信源吧


--【陆】--:

从之前 DS 开源的算子实现和现在的技术报告看,训练部分大概率还是 NVIDIA 为主力:

图片1678×1487 499 KB

只不过确实部分关键算子比如 MegaMoE 这些适配了 Ascend NPU,还有一部分算子使用 TileLang 实现,应该也适配了 Ascend NPU:

图片1593×538 92.9 KB

图片1709×1245 208 KB


--【柒】--:

之前的V3也能用昇腾推理呀,如果单纯只是用昇腾推理,感觉没什么奇特的呢


--【捌】--:

训练用谁没那么重要

推理成本才是落地的大头