《是有两个版本,base是1.6T》DeepSeek v4开源版不是满血版?

2026-04-29 10:281阅读0评论SEO资讯
  • 内容介绍
  • 文章标签
  • 相关推荐
问题描述:

image2488×1660 372 KB

huggingface上的模型尺寸是862B
技术报告里是 1.6T
image1666×1688 523 KB

没事了,还有个deepseek-ai/DeepSeek-V4-Pro-Base模型,这个是1.6

网友解答:
--【壹】--:

DeepSeek-V4-Pro是那个FP4量化版吧,ModelScpoe那边这个模型标的也是1.6T


--【贰】--:
huggingface.co

deepseek-ai/DeepSeek-V4-Pro-Base · Hugging Face

We’re on a journey to advance and democratize artificial intelligence through open source and open science.


--【叁】--:

*FP4 + FP8 Mixed: MoE expert parameters use FP4 precision; most other parameters use FP8.

DeepSeek-V4-Pro 的 model card 上面参数类型还是 FP8,参数量应该是 Hugging Face 计算错了


--【肆】--:

还有一个pro max版本,有小字的–!