Huggingface已上线Deepseek v4?!

2026-04-29 10:342阅读0评论SEO教程

内容介绍
文章标签
相关推荐

问题描述：

Huggingface已上线Deepseek v4 PRO参数量1.6T
image965×524 49.7 KB

链接:https://huggingface.co/deepseek-ai/DeepSeek-V4-Pro-Base/tree/main 已开源可下载

网友解答：

--【壹】--：

8b26596be6ead8f94cc84c8d553de0071920×1320 229 KB
image1077×204 88.8 KB
I1EE2ZEXGQ2HQ}1U768Itmb1280×946 111 KB

--【贰】--：

最近为什么都在吐槽deepseek蒸馏，有多少人或者公司因为deepseek降了成本，它开源的代码，哪家大模型没有参考引用。别人蒸馏也没见吐槽啥的。到deepseek就一堆人抓着蒸馏不放了

--【叁】--：

5}5530E$R5CC{EJ$WHJI1805×807 150 KB
arena的coding榜单上看还差点意思,看看其他榜单测出来是什么样的

--【肆】--：

上下文召回能力有点恐怖 83.5% 1M窗口,但是gemini以前跑分有这么高吗?我感觉哈基米编码能力在三家里是最弱的 glm都比它强

--【伍】--：

image734×589 25.2 KB
image715×558 29.1 KB
似乎没有原生多模态支持

--【陆】--：

PixPin2026-04-2411-23-49859×672 110 KB

--【柒】--：

技术报告

huggingface.co

DeepSeek_V4.pdf

68.21 KB

--【捌】--：

对，Deepseek那个论文里面也说没有

--【玖】--：

说明对 DS 期待比较高。希望他超越，而不是在别人的基础上没有创新。不过蒸馏是共同进步，DS 也使用模型新架构。总体还是不错的。

--【拾】--：

蒸出来好东西了！！哈哈哈，还是挺好的呀，追平，价格腰斩

--【拾壹】--：

终于来了
这个新模型，支不支持多模态呢？

--【拾贰】--：

感觉超越gpt A 只是时间问题至少现在看应该可以平替了价格还便宜

--【拾叁】--：

本身国产适配就是难啃的骨头，现在不管怎样能达到接近顶尖避源模型的能力的情况下，费用降60倍已经很厉害了。

--【拾肆】--：

蒸馏是门好技术啊，没必要吐槽，效果上来了就行

--【拾伍】--：

1.6T就是不一样,力大飞砖,这下压力给到御三家了.

--【拾陆】--：

牛逼啊，上线即开源，深度求索牛逼，坐等评测

--【拾柒】--： LuLu:

我感觉哈基米编码能力在三家里是最弱的

谷歌算力不够,TPU租出去卖钱了,我们自用的时候,付费层级太低,智商被砍了很多.光纸面参数,pro3.1还是很强的.

--【拾捌】--：

image763×865 80.9 KB
开源并追平5.4xhigh?!

--【拾玖】--：

果然。。。gpt5.5一出，马上ds就追上

标签：人工智能

问题描述：

Huggingface已上线Deepseek v4 PRO参数量1.6T
image965×524 49.7 KB

链接:https://huggingface.co/deepseek-ai/DeepSeek-V4-Pro-Base/tree/main 已开源可下载

网友解答：

--【壹】--：

8b26596be6ead8f94cc84c8d553de0071920×1320 229 KB
image1077×204 88.8 KB
I1EE2ZEXGQ2HQ}1U768Itmb1280×946 111 KB

--【贰】--：

--【叁】--：

5}5530E$R5CC{EJ$WHJI1805×807 150 KB
arena的coding榜单上看还差点意思,看看其他榜单测出来是什么样的

--【肆】--：

上下文召回能力有点恐怖 83.5% 1M窗口,但是gemini以前跑分有这么高吗?我感觉哈基米编码能力在三家里是最弱的 glm都比它强

--【伍】--：

image734×589 25.2 KB
image715×558 29.1 KB
似乎没有原生多模态支持

--【陆】--：

PixPin2026-04-2411-23-49859×672 110 KB

--【柒】--：

技术报告

huggingface.co

DeepSeek_V4.pdf

68.21 KB

--【捌】--：

对，Deepseek那个论文里面也说没有

--【玖】--：

说明对 DS 期待比较高。希望他超越，而不是在别人的基础上没有创新。不过蒸馏是共同进步，DS 也使用模型新架构。总体还是不错的。

--【拾】--：

蒸出来好东西了！！哈哈哈，还是挺好的呀，追平，价格腰斩

--【拾壹】--：

终于来了
这个新模型，支不支持多模态呢？

--【拾贰】--：

感觉超越gpt A 只是时间问题至少现在看应该可以平替了价格还便宜

--【拾叁】--：

本身国产适配就是难啃的骨头，现在不管怎样能达到接近顶尖避源模型的能力的情况下，费用降60倍已经很厉害了。

--【拾肆】--：

蒸馏是门好技术啊，没必要吐槽，效果上来了就行

--【拾伍】--：

1.6T就是不一样,力大飞砖,这下压力给到御三家了.

--【拾陆】--：

牛逼啊，上线即开源，深度求索牛逼，坐等评测

--【拾柒】--： LuLu:

我感觉哈基米编码能力在三家里是最弱的

谷歌算力不够,TPU租出去卖钱了,我们自用的时候,付费层级太低,智商被砍了很多.光纸面参数,pro3.1还是很强的.

--【拾捌】--：

image763×865 80.9 KB
开源并追平5.4xhigh?!

--【拾玖】--：

果然。。。gpt5.5一出，马上ds就追上

标签：人工智能

DeepSeek_V4.pdf

相关推荐

DeepSeek_V4.pdf

相关推荐