【辟谣】智谱glm5和deepseekv4大部分训练都用的英伟达,而不是站里某些人传的昇腾
- 内容介绍
- 文章标签
- 相关推荐
glm5有官方technical report,deepseekv4也有英文文档。连接如下
https://arxiv.org/pdf/2602.15763
DeepSeek_V4.pdf
68.21 KB
网友解答:--【壹】--:
对,GLM我记得只有IMAGE是在华为全流程训练的,这个应该是GLM用来实验的
--【贰】--:
好像一直没啥人提训练用华为吧
不都是在说推理端被大手强制绑定华子了
--【叁】--:
所以算子到底是个啥,是个物理结构,还是个算法的逻辑量化单元?
--【肆】--:
对,毕竟英伟达的护城河还是很难绕过去的,不过好歹有个开头了。
--【伍】--:
那看起来cuda生态还是没办法摆脱,还是不可撼动的
--【陆】--:
cann的算子现在还缺的很多,训练的难度跟推理部署的难度不是一个数量级
--【柒】--:
刚看到这张图,只能说某些自媒体的想象力还蛮丰富的,经典捧杀
Image17770105052805181222×358 61.6 KB
--【捌】--:
是的,但是很难确认是跑通了还是跑出好效果了,这点存疑。预训练绝对是nVidia了
--【玖】--:
image1727×375 157 KB
可以看到deepseek还在用他们给cuda写的库deepgemm
--【拾】--:
国产芯片 用于训练,还是太过勉强啊。。 即使算力达到,SDK 软件方面 还是比不过CUDA啊。
国产能用于推理,就足够了。至少能带动国产芯片需求,目的达到了。
--【拾壹】--:
可以的兄弟,可以的,DSV4-Flash 的续训练可以在昇腾上训练的。
--【拾贰】--:
大家都不是默认训练用cuda,推理用的是华子吗
--【拾叁】--: yjian zhu:
glm5不知道怎么回事,明明是推理优化,非要传谣成了用昇腾训练的
鬼知道怎么传出来的,当时我也看到了有营销号说,但是官方推文没写,默认是假的,应该理解错误了官方推文中GLM5首发适配华为
--【拾肆】--:
去年r1出来的时候,很多自媒体一样的瞎吹,爱国buff还是有流量
--【拾伍】--:
神经网络里面的计算都是要用算子实现,例如 加减乘除,矩阵运算,卷积 等等
--【拾陆】--:
image1674×708 439 KB
glm5的report里面只写了在推理上给昇腾做了优化
--【拾柒】--:
是的,这个glm发海报了,glm5不知道怎么回事,明明是推理优化,非要传谣成了用昇腾训练的
--【拾捌】--:
不是一直都是说推理吗,就这还各种ds药丸,华为大手,什么一看到这两个字就不适的言论各种袭来,也不知道这些人哪里来的恨意呢
--【拾玖】--:
昇腾目前没法做模型训练吧,只能部署使用,训练应该还得再等新卡
glm5有官方technical report,deepseekv4也有英文文档。连接如下
https://arxiv.org/pdf/2602.15763
DeepSeek_V4.pdf
68.21 KB
网友解答:--【壹】--:
对,GLM我记得只有IMAGE是在华为全流程训练的,这个应该是GLM用来实验的
--【贰】--:
好像一直没啥人提训练用华为吧
不都是在说推理端被大手强制绑定华子了
--【叁】--:
所以算子到底是个啥,是个物理结构,还是个算法的逻辑量化单元?
--【肆】--:
对,毕竟英伟达的护城河还是很难绕过去的,不过好歹有个开头了。
--【伍】--:
那看起来cuda生态还是没办法摆脱,还是不可撼动的
--【陆】--:
cann的算子现在还缺的很多,训练的难度跟推理部署的难度不是一个数量级
--【柒】--:
刚看到这张图,只能说某些自媒体的想象力还蛮丰富的,经典捧杀
Image17770105052805181222×358 61.6 KB
--【捌】--:
是的,但是很难确认是跑通了还是跑出好效果了,这点存疑。预训练绝对是nVidia了
--【玖】--:
image1727×375 157 KB
可以看到deepseek还在用他们给cuda写的库deepgemm
--【拾】--:
国产芯片 用于训练,还是太过勉强啊。。 即使算力达到,SDK 软件方面 还是比不过CUDA啊。
国产能用于推理,就足够了。至少能带动国产芯片需求,目的达到了。
--【拾壹】--:
可以的兄弟,可以的,DSV4-Flash 的续训练可以在昇腾上训练的。
--【拾贰】--:
大家都不是默认训练用cuda,推理用的是华子吗
--【拾叁】--: yjian zhu:
glm5不知道怎么回事,明明是推理优化,非要传谣成了用昇腾训练的
鬼知道怎么传出来的,当时我也看到了有营销号说,但是官方推文没写,默认是假的,应该理解错误了官方推文中GLM5首发适配华为
--【拾肆】--:
去年r1出来的时候,很多自媒体一样的瞎吹,爱国buff还是有流量
--【拾伍】--:
神经网络里面的计算都是要用算子实现,例如 加减乘除,矩阵运算,卷积 等等
--【拾陆】--:
image1674×708 439 KB
glm5的report里面只写了在推理上给昇腾做了优化
--【拾柒】--:
是的,这个glm发海报了,glm5不知道怎么回事,明明是推理优化,非要传谣成了用昇腾训练的
--【拾捌】--:
不是一直都是说推理吗,就这还各种ds药丸,华为大手,什么一看到这两个字就不适的言论各种袭来,也不知道这些人哪里来的恨意呢
--【拾玖】--:
昇腾目前没法做模型训练吧,只能部署使用,训练应该还得再等新卡

