【辟谣】智谱glm5和deepseekv4大部分训练都用的英伟达,而不是站里某些人传的昇腾

2026-04-29 09:142阅读0评论SEO资源
  • 内容介绍
  • 文章标签
  • 相关推荐
问题描述:

glm5有官方technical report,deepseekv4也有英文文档。连接如下
https://arxiv.org/pdf/2602.15763

huggingface.co

DeepSeek_V4.pdf

68.21 KB

网友解答:
--【壹】--:

对,GLM我记得只有IMAGE是在华为全流程训练的,这个应该是GLM用来实验的


--【贰】--:

好像一直没啥人提训练用华为吧
不都是在说推理端被大手强制绑定华子了


--【叁】--:

所以算子到底是个啥,是个物理结构,还是个算法的逻辑量化单元?


--【肆】--:

对,毕竟英伟达的护城河还是很难绕过去的,不过好歹有个开头了。


--【伍】--:

那看起来cuda生态还是没办法摆脱,还是不可撼动的


--【陆】--:

cann的算子现在还缺的很多,训练的难度跟推理部署的难度不是一个数量级


--【柒】--:

刚看到这张图,只能说某些自媒体的想象力还蛮丰富的,经典捧杀
Image17770105052805181222×358 61.6 KB


--【捌】--:

是的,但是很难确认是跑通了还是跑出好效果了,这点存疑。预训练绝对是nVidia了


--【玖】--:

image1727×375 157 KB
可以看到deepseek还在用他们给cuda写的库deepgemm


--【拾】--:

国产芯片 用于训练,还是太过勉强啊。。 即使算力达到,SDK 软件方面 还是比不过CUDA啊。