【辟谣】智谱glm5和deepseekv4大部分训练都用的英伟达,而不是站里某些人传的昇腾
- 内容介绍
- 文章标签
- 相关推荐
glm5有官方technical report,deepseekv4也有英文文档。连接如下
https://arxiv.org/pdf/2602.15763
DeepSeek_V4.pdf
68.21 KB
网友解答:--【壹】--:
对,GLM我记得只有IMAGE是在华为全流程训练的,这个应该是GLM用来实验的
--【贰】--:
好像一直没啥人提训练用华为吧
不都是在说推理端被大手强制绑定华子了
--【叁】--:
所以算子到底是个啥,是个物理结构,还是个算法的逻辑量化单元?
--【肆】--:
对,毕竟英伟达的护城河还是很难绕过去的,不过好歹有个开头了。
--【伍】--:
那看起来cuda生态还是没办法摆脱,还是不可撼动的
--【陆】--:
cann的算子现在还缺的很多,训练的难度跟推理部署的难度不是一个数量级
--【柒】--:
刚看到这张图,只能说某些自媒体的想象力还蛮丰富的,经典捧杀
Image17770105052805181222×358 61.6 KB
--【捌】--:
是的,但是很难确认是跑通了还是跑出好效果了,这点存疑。预训练绝对是nVidia了
--【玖】--:
image1727×375 157 KB
可以看到deepseek还在用他们给cuda写的库deepgemm
--【拾】--:
国产芯片 用于训练,还是太过勉强啊。。 即使算力达到,SDK 软件方面 还是比不过CUDA啊。
glm5有官方technical report,deepseekv4也有英文文档。连接如下
https://arxiv.org/pdf/2602.15763
DeepSeek_V4.pdf
68.21 KB
网友解答:--【壹】--:
对,GLM我记得只有IMAGE是在华为全流程训练的,这个应该是GLM用来实验的
--【贰】--:
好像一直没啥人提训练用华为吧
不都是在说推理端被大手强制绑定华子了
--【叁】--:
所以算子到底是个啥,是个物理结构,还是个算法的逻辑量化单元?
--【肆】--:
对,毕竟英伟达的护城河还是很难绕过去的,不过好歹有个开头了。
--【伍】--:
那看起来cuda生态还是没办法摆脱,还是不可撼动的
--【陆】--:
cann的算子现在还缺的很多,训练的难度跟推理部署的难度不是一个数量级
--【柒】--:
刚看到这张图,只能说某些自媒体的想象力还蛮丰富的,经典捧杀
Image17770105052805181222×358 61.6 KB
--【捌】--:
是的,但是很难确认是跑通了还是跑出好效果了,这点存疑。预训练绝对是nVidia了
--【玖】--:
image1727×375 157 KB
可以看到deepseek还在用他们给cuda写的库deepgemm
--【拾】--:
国产芯片 用于训练,还是太过勉强啊。。 即使算力达到,SDK 软件方面 还是比不过CUDA啊。

