Huggingface已上线Deepseek v4?!
- 内容介绍
- 文章标签
- 相关推荐
Huggingface已上线Deepseek v4 PRO参数量1.6T
image965×524 49.7 KB
链接:https://huggingface.co/deepseek-ai/DeepSeek-V4-Pro-Base/tree/main 已开源可下载
网友解答:--【壹】--:
8b26596be6ead8f94cc84c8d553de0071920×1320 229 KB
image1077×204 88.8 KB
I1EE2ZEXGQ2HQ}1U768Itmb1280×946 111 KB
--【贰】--:
最近为什么都在吐槽deepseek蒸馏,有多少人或者公司因为deepseek降了成本,它开源的代码,哪家大模型没有参考引用。别人蒸馏也没见吐槽啥的。到deepseek就一堆人抓着蒸馏不放了
--【叁】--:
5}5530E$R5CC{EJ$WHJI1805×807 150 KB
arena的coding榜单上看还差点意思,看看其他榜单测出来是什么样的
--【肆】--:
上下文召回能力有点恐怖 83.5% 1M窗口,但是gemini以前跑分有这么高吗?我感觉哈基米编码能力在三家里是最弱的 glm都比它强
--【伍】--:
image734×589 25.2 KB
image715×558 29.1 KB
似乎没有原生多模态支持
--【陆】--:
PixPin2026-04-2411-23-49859×672 110 KB
--【柒】--:
技术报告
DeepSeek_V4.pdf
68.21 KB
--【捌】--:
对,Deepseek那个论文里面也说没有
--【玖】--:
说明对 DS 期待比较高。希望他超越,而不是在别人的基础上没有创新。不过蒸馏是共同进步,DS 也使用模型新架构。总体还是不错的。
--【拾】--:
蒸出来好东西了!!哈哈哈,还是挺好的呀,追平,价格腰斩
--【拾壹】--:
终于来了
这个新模型,支不支持多模态呢?
--【拾贰】--:
感觉超越gpt A 只是时间问题 至少现在看 应该可以平替了 价格还便宜
--【拾叁】--:
本身国产适配就是难啃的骨头,现在不管怎样能达到接近顶尖避源模型的能力的情况下,费用降60倍已经很厉害了。
--【拾肆】--:
蒸馏是门好技术啊,没必要吐槽,效果上来了就行
--【拾伍】--:
1.6T就是不一样,力大飞砖,这下压力给到御三家了.
--【拾陆】--:
牛逼啊,上线即开源,深度求索牛逼,坐等评测
--【拾柒】--: LuLu:
我感觉哈基米编码能力在三家里是最弱的
谷歌算力不够,TPU租出去卖钱了,我们自用的时候,付费层级太低,智商被砍了很多.光纸面参数,pro3.1还是很强的.
--【拾捌】--:
image763×865 80.9 KB
开源并追平5.4xhigh?!
--【拾玖】--:
果然。。。gpt5.5一出,马上ds就追上
Huggingface已上线Deepseek v4 PRO参数量1.6T
image965×524 49.7 KB
链接:https://huggingface.co/deepseek-ai/DeepSeek-V4-Pro-Base/tree/main 已开源可下载
网友解答:--【壹】--:
8b26596be6ead8f94cc84c8d553de0071920×1320 229 KB
image1077×204 88.8 KB
I1EE2ZEXGQ2HQ}1U768Itmb1280×946 111 KB
--【贰】--:
最近为什么都在吐槽deepseek蒸馏,有多少人或者公司因为deepseek降了成本,它开源的代码,哪家大模型没有参考引用。别人蒸馏也没见吐槽啥的。到deepseek就一堆人抓着蒸馏不放了
--【叁】--:
5}5530E$R5CC{EJ$WHJI1805×807 150 KB
arena的coding榜单上看还差点意思,看看其他榜单测出来是什么样的
--【肆】--:
上下文召回能力有点恐怖 83.5% 1M窗口,但是gemini以前跑分有这么高吗?我感觉哈基米编码能力在三家里是最弱的 glm都比它强
--【伍】--:
image734×589 25.2 KB
image715×558 29.1 KB
似乎没有原生多模态支持
--【陆】--:
PixPin2026-04-2411-23-49859×672 110 KB
--【柒】--:
技术报告
DeepSeek_V4.pdf
68.21 KB
--【捌】--:
对,Deepseek那个论文里面也说没有
--【玖】--:
说明对 DS 期待比较高。希望他超越,而不是在别人的基础上没有创新。不过蒸馏是共同进步,DS 也使用模型新架构。总体还是不错的。
--【拾】--:
蒸出来好东西了!!哈哈哈,还是挺好的呀,追平,价格腰斩
--【拾壹】--:
终于来了
这个新模型,支不支持多模态呢?
--【拾贰】--:
感觉超越gpt A 只是时间问题 至少现在看 应该可以平替了 价格还便宜
--【拾叁】--:
本身国产适配就是难啃的骨头,现在不管怎样能达到接近顶尖避源模型的能力的情况下,费用降60倍已经很厉害了。
--【拾肆】--:
蒸馏是门好技术啊,没必要吐槽,效果上来了就行
--【拾伍】--:
1.6T就是不一样,力大飞砖,这下压力给到御三家了.
--【拾陆】--:
牛逼啊,上线即开源,深度求索牛逼,坐等评测
--【拾柒】--: LuLu:
我感觉哈基米编码能力在三家里是最弱的
谷歌算力不够,TPU租出去卖钱了,我们自用的时候,付费层级太低,智商被砍了很多.光纸面参数,pro3.1还是很强的.
--【拾捌】--:
image763×865 80.9 KB
开源并追平5.4xhigh?!
--【拾玖】--:
果然。。。gpt5.5一出,马上ds就追上

