【辟谣】智谱glm5和deepseekv4大部分训练都用的英伟达,而不是站里某些人传的昇腾

2026-04-29 09:145阅读0评论SEO资源
  • 内容介绍
  • 文章标签
  • 相关推荐
问题描述:

glm5有官方technical report,deepseekv4也有英文文档。连接如下
https://arxiv.org/pdf/2602.15763

huggingface.co

DeepSeek_V4.pdf

68.21 KB

网友解答:
--【壹】--:

对,GLM我记得只有IMAGE是在华为全流程训练的,这个应该是GLM用来实验的


--【贰】--:

好像一直没啥人提训练用华为吧
不都是在说推理端被大手强制绑定华子了


--【叁】--:

所以算子到底是个啥,是个物理结构,还是个算法的逻辑量化单元?


--【肆】--:

对,毕竟英伟达的护城河还是很难绕过去的,不过好歹有个开头了。


--【伍】--:

那看起来cuda生态还是没办法摆脱,还是不可撼动的


--【陆】--:

cann的算子现在还缺的很多,训练的难度跟推理部署的难度不是一个数量级


--【柒】--:

刚看到这张图,只能说某些自媒体的想象力还蛮丰富的,经典捧杀
Image17770105052805181222×358 61.6 KB


--【捌】--:

是的,但是很难确认是跑通了还是跑出好效果了,这点存疑。预训练绝对是nVidia了


--【玖】--:

image1727×375 157 KB
可以看到deepseek还在用他们给cuda写的库deepgemm


--【拾】--:

国产芯片 用于训练,还是太过勉强啊。。 即使算力达到,SDK 软件方面 还是比不过CUDA啊。

国产能用于推理,就足够了。至少能带动国产芯片需求,目的达到了。


--【拾壹】--:

可以的兄弟,可以的,DSV4-Flash 的续训练可以在昇腾上训练的。


--【拾贰】--:

大家都不是默认训练用cuda,推理用的是华子吗


--【拾叁】--: yjian zhu:

glm5不知道怎么回事,明明是推理优化,非要传谣成了用昇腾训练的

鬼知道怎么传出来的,当时我也看到了有营销号说,但是官方推文没写,默认是假的,应该理解错误了官方推文中GLM5首发适配华为


--【拾肆】--:

去年r1出来的时候,很多自媒体一样的瞎吹,爱国buff还是有流量


--【拾伍】--:

神经网络里面的计算都是要用算子实现,例如 加减乘除,矩阵运算,卷积 等等


--【拾陆】--:

image1674×708 439 KB
glm5的report里面只写了在推理上给昇腾做了优化


--【拾柒】--:

是的,这个glm发海报了,glm5不知道怎么回事,明明是推理优化,非要传谣成了用昇腾训练的


--【拾捌】--:

不是一直都是说推理吗,就这还各种ds药丸,华为大手,什么一看到这两个字就不适的言论各种袭来,也不知道这些人哪里来的恨意呢


--【拾玖】--:

昇腾目前没法做模型训练吧,只能部署使用,训练应该还得再等新卡