DeepseekV4上线,模型在下了,昇腾的部署文档快端上来吧,已经饥渴难耐了

2026-04-29 10:321阅读0评论SEO问题
  • 内容介绍
  • 文章标签
  • 相关推荐
问题描述:

image1920×1066 539 KB
还记得上次部署deepseek还是在上次

网友解答:
--【壹】--:

文档里写的1.6T,FP8+FP4混合推理


--【贰】--:

1.6t说的是基座模型,一般不会部署这个。


--【叁】--:

只是个人使用昇腾的一点经验,还是得看官方怎么说


--【肆】--:

抱抱脸不是有900b左右的deepseekv4pro吗


--【伍】--:

我去佬用什么电脑部署的,是多少参数的,不知道消费级显卡能跑吗


--【陆】--:

是的,三台可能都不够。前一段时间部署Minimax2.5,用的fp8精度,但是910B不支持,被反量化到BF16,显存就炸了。我现在下的还只是Flash,如果是pro的话,考虑到被反量化的问题,会直接干到3.2TB+的显存,再算上KV Cache和其他消耗,可能得3.5-4TB。至少 56-64 张(7-8 台机器)


--【柒】--:

是客户的910B,一台512G显存,要两台吧。正好放假了能给我霍霍


--【捌】--:

1.6t想舒服点运行得三台啊,是这样吗?

标签:人工智能
问题描述:

image1920×1066 539 KB
还记得上次部署deepseek还是在上次

网友解答:
--【壹】--:

文档里写的1.6T,FP8+FP4混合推理


--【贰】--:

1.6t说的是基座模型,一般不会部署这个。


--【叁】--:

只是个人使用昇腾的一点经验,还是得看官方怎么说


--【肆】--:

抱抱脸不是有900b左右的deepseekv4pro吗


--【伍】--:

我去佬用什么电脑部署的,是多少参数的,不知道消费级显卡能跑吗


--【陆】--:

是的,三台可能都不够。前一段时间部署Minimax2.5,用的fp8精度,但是910B不支持,被反量化到BF16,显存就炸了。我现在下的还只是Flash,如果是pro的话,考虑到被反量化的问题,会直接干到3.2TB+的显存,再算上KV Cache和其他消耗,可能得3.5-4TB。至少 56-64 张(7-8 台机器)


--【柒】--:

是客户的910B,一台512G显存,要两台吧。正好放假了能给我霍霍


--【捌】--:

1.6t想舒服点运行得三台啊,是这样吗?

标签:人工智能