【辟谣】智谱glm5和deepseekv4大部分训练都用的英伟达，而不是站里某些人传的昇腾

2026-04-29 09:142阅读0评论SEO资源

内容介绍
文章标签
相关推荐

问题描述：

glm5有官方technical report，deepseekv4也有英文文档。连接如下
https://arxiv.org/pdf/2602.15763

huggingface.co

DeepSeek_V4.pdf

68.21 KB

网友解答：

--【壹】--：

对，GLM我记得只有IMAGE是在华为全流程训练的，这个应该是GLM用来实验的

--【贰】--：

好像一直没啥人提训练用华为吧
不都是在说推理端被大手强制绑定华子了

--【叁】--：

所以算子到底是个啥，是个物理结构，还是个算法的逻辑量化单元？

--【肆】--：

对，毕竟英伟达的护城河还是很难绕过去的，不过好歹有个开头了。

--【伍】--：

那看起来cuda生态还是没办法摆脱，还是不可撼动的

--【陆】--：

cann的算子现在还缺的很多，训练的难度跟推理部署的难度不是一个数量级

--【柒】--：

刚看到这张图，只能说某些自媒体的想象力还蛮丰富的，经典捧杀
Image17770105052805181222×358 61.6 KB

--【捌】--：

是的，但是很难确认是跑通了还是跑出好效果了，这点存疑。预训练绝对是nVidia了

--【玖】--：

image1727×375 157 KB
可以看到deepseek还在用他们给cuda写的库deepgemm

--【拾】--：

国产芯片用于训练，还是太过勉强啊。。即使算力达到，SDK 软件方面还是比不过CUDA啊。

阅读全文

标签：DeepSeek GLM

问题描述：

glm5有官方technical report，deepseekv4也有英文文档。连接如下
https://arxiv.org/pdf/2602.15763

huggingface.co

DeepSeek_V4.pdf

68.21 KB

网友解答：

--【壹】--：

对，GLM我记得只有IMAGE是在华为全流程训练的，这个应该是GLM用来实验的

--【贰】--：

好像一直没啥人提训练用华为吧
不都是在说推理端被大手强制绑定华子了

--【叁】--：

所以算子到底是个啥，是个物理结构，还是个算法的逻辑量化单元？

--【肆】--：

对，毕竟英伟达的护城河还是很难绕过去的，不过好歹有个开头了。

--【伍】--：

那看起来cuda生态还是没办法摆脱，还是不可撼动的

--【陆】--：

cann的算子现在还缺的很多，训练的难度跟推理部署的难度不是一个数量级

--【柒】--：

刚看到这张图，只能说某些自媒体的想象力还蛮丰富的，经典捧杀
Image17770105052805181222×358 61.6 KB

--【捌】--：

是的，但是很难确认是跑通了还是跑出好效果了，这点存疑。预训练绝对是nVidia了

--【玖】--：

image1727×375 157 KB
可以看到deepseek还在用他们给cuda写的库deepgemm

--【拾】--：

国产芯片用于训练，还是太过勉强啊。。即使算力达到，SDK 软件方面还是比不过CUDA啊。

阅读全文

标签：DeepSeek GLM

DeepSeek_V4.pdf

相关推荐

DeepSeek_V4.pdf

相关推荐