《是有两个版本,base是1.6T》DeepSeek v4开源版不是满血版?
- 内容介绍
- 文章标签
- 相关推荐
image2488×1660 372 KB
huggingface上的模型尺寸是862B
技术报告里是 1.6T
image1666×1688 523 KB
没事了,还有个deepseek-ai/DeepSeek-V4-Pro-Base模型,这个是1.6
网友解答:--【壹】--:
DeepSeek-V4-Pro是那个FP4量化版吧,ModelScpoe那边这个模型标的也是1.6T
--【贰】--:
deepseek-ai/DeepSeek-V4-Pro-Base · Hugging Face
We’re on a journey to advance and democratize artificial intelligence through open source and open science.
--【叁】--:
*FP4 + FP8 Mixed: MoE expert parameters use FP4 precision; most other parameters use FP8.
DeepSeek-V4-Pro 的 model card 上面参数类型还是 FP8,参数量应该是 Hugging Face 计算错了
--【肆】--:
还有一个pro max版本,有小字的–!
image2488×1660 372 KB
huggingface上的模型尺寸是862B
技术报告里是 1.6T
image1666×1688 523 KB
没事了,还有个deepseek-ai/DeepSeek-V4-Pro-Base模型,这个是1.6
网友解答:--【壹】--:
DeepSeek-V4-Pro是那个FP4量化版吧,ModelScpoe那边这个模型标的也是1.6T
--【贰】--:
deepseek-ai/DeepSeek-V4-Pro-Base · Hugging Face
We’re on a journey to advance and democratize artificial intelligence through open source and open science.
--【叁】--:
*FP4 + FP8 Mixed: MoE expert parameters use FP4 precision; most other parameters use FP8.
DeepSeek-V4-Pro 的 model card 上面参数类型还是 FP8,参数量应该是 Hugging Face 计算错了
--【肆】--:
还有一个pro max版本,有小字的–!

