Huggingface已上线Deepseek v4?!

2026-04-29 10:342阅读0评论SEO教程
  • 内容介绍
  • 文章标签
  • 相关推荐
问题描述:

Huggingface已上线Deepseek v4 PRO参数量1.6T
image965×524 49.7 KB

链接:https://huggingface.co/deepseek-ai/DeepSeek-V4-Pro-Base/tree/main 已开源可下载

网友解答:
--【壹】--:

8b26596be6ead8f94cc84c8d553de0071920×1320 229 KB
image1077×204 88.8 KB
I1EE2ZEXGQ2HQ}1U768Itmb1280×946 111 KB


--【贰】--:

最近为什么都在吐槽deepseek蒸馏,有多少人或者公司因为deepseek降了成本,它开源的代码,哪家大模型没有参考引用。别人蒸馏也没见吐槽啥的。到deepseek就一堆人抓着蒸馏不放了


--【叁】--:

5}5530E$R5CC{EJ$WHJI1805×807 150 KB
arena的coding榜单上看还差点意思,看看其他榜单测出来是什么样的


--【肆】--:

上下文召回能力有点恐怖 83.5% 1M窗口,但是gemini以前跑分有这么高吗?我感觉哈基米编码能力在三家里是最弱的 glm都比它强


--【伍】--:

image734×589 25.2 KB
image715×558 29.1 KB
似乎没有原生多模态支持


--【陆】--:

PixPin2026-04-2411-23-49859×672 110 KB


--【柒】--:

技术报告

huggingface.co

DeepSeek_V4.pdf

68.21 KB


--【捌】--:

对,Deepseek那个论文里面也说没有


--【玖】--:

说明对 DS 期待比较高。希望他超越,而不是在别人的基础上没有创新。不过蒸馏是共同进步,DS 也使用模型新架构。总体还是不错的。


--【拾】--:

蒸出来好东西了!!哈哈哈,还是挺好的呀,追平,价格腰斩


--【拾壹】--:

终于来了
这个新模型,支不支持多模态呢?


--【拾贰】--:

感觉超越gpt A​ 只是时间问题 至少现在看 应该可以平替了 价格还便宜


--【拾叁】--:

本身国产适配就是难啃的骨头,现在不管怎样能达到接近顶尖避源模型的能力的情况下,费用降60倍已经很厉害了。


--【拾肆】--:

蒸馏是门好技术啊,没必要吐槽,效果上来了就行


--【拾伍】--:

1.6T就是不一样,力大飞砖,这下压力给到御三家了.


--【拾陆】--:

牛逼啊,上线即开源,深度求索牛逼,坐等评测


--【拾柒】--: LuLu:

我感觉哈基米编码能力在三家里是最弱的

谷歌算力不够,TPU租出去卖钱了,我们自用的时候,付费层级太低,智商被砍了很多.光纸面参数,pro3.1还是很强的.


--【拾捌】--:

image763×865 80.9 KB
开源并追平5.4xhigh?!


--【拾玖】--:

果然。。。gpt5.5一出,马上ds就追上