🔥【大模型系列33】关于Deepseek 4,你想知道的一切【更新LMArena评分】
- 内容介绍
- 文章标签
- 相关推荐
问题描述:
基本资料
官方模型卡:DeepSeek_V4.pdf · deepseek-ai/DeepSeek-V4-Pro at main
deepseek-4-pro
输入¥12,输出¥24,缓存1/12
上下文1m,最大输出384k,ds3.2是160k/160k
参数1600B,激活49B,ds3.2是685B
预训练数据33T,预训练数据33T,截止日期25年5月
平台:华为昇腾
image752×249 6.1 KB
deepseek-4-flash
输入¥1,输出¥2,缓存1/5
上下文1m,最大输出384k
参数284B,激活49B
训练同上
优点
1m上下文,384k输出
开源第一梯队
国产昇腾平台
缺点
多模态
没有Coding Plan
速度不快
公众号:受限于高端算力,目前 Pro 的服务吞吐十分有限,预计下半年昇腾 950 超节点批量上市后,Pro 的价格会大幅下调。
问题描述:
基本资料
官方模型卡:DeepSeek_V4.pdf · deepseek-ai/DeepSeek-V4-Pro at main
deepseek-4-pro
输入¥12,输出¥24,缓存1/12
上下文1m,最大输出384k,ds3.2是160k/160k
参数1600B,激活49B,ds3.2是685B
预训练数据33T,预训练数据33T,截止日期25年5月
平台:华为昇腾
image752×249 6.1 KB
deepseek-4-flash
输入¥1,输出¥2,缓存1/5
上下文1m,最大输出384k
参数284B,激活49B
训练同上
优点
1m上下文,384k输出
开源第一梯队
国产昇腾平台
缺点
多模态
没有Coding Plan
速度不快
公众号:受限于高端算力,目前 Pro 的服务吞吐十分有限,预计下半年昇腾 950 超节点批量上市后,Pro 的价格会大幅下调。

