今晚(4 月 23 日)deepseekv4 能发吗?
- 内容介绍
- 文章标签
- 相关推荐
想问下各位佬有消息吗?不是我看说好像四月底 dsv4 要准备发了吗?感觉一直在测试啊。希望能够来个大的好不,真的要被 Claude 还有智谱恶心坏了。能不能今晚就发,拜托!!!
网友解答:--【壹】--:
原来是这样,从过年一直传到现在,嘶,不知道还要多久发。华为昇腾的芯片真的。。。可以吗?
--【贰】--:
今晚不要睡 大的要来了
image225×225 42.3 KB
--【叁】--:
今天还不发,大概率就要等五月了,ds大版本的模型更行好像没有周五发的
--【肆】--:
害,好吧,辛苦佬回答了,能不能大概 sonnet4.6 的水平啊,我就很满足了
--【伍】--:
不是已经发了吗,我都用上了,你们没叮到咚鸡吗?
--【陆】--:
哈哈哈哈,佬友你发的这个梗图好好笑哈哈。
--【柒】--:
大的要来了小助手,给我整笑了,佬友太有画面了
--【捌】--:
我反而觉得Deepseek v4也许会带来一些新的技术方案?
然后国内模型都有阶段性的提升?
(希望如此,个人观点及猜测)
--【玖】--:
其实我更期待 GPT 5.5
DeepSeek v4 我并不看好,我估计会凉
应为v4早都应该弄好了,只不过没发布
可是其他模型赶的太快了,v4可能还没发布就落后了
--【拾】--:
哇,看来佬更多的可能是从技术层面来看待,可惜我只是一个学生,目前还涉及的太少 hhh
--【拾壹】--:
是的,我期望的就是这个,我也不对v4抱什么立马就提升很大的想法,我更希望新的技术方案~
--【拾贰】--:
参考他们发布的套路,应该是五一发或者五一前一天晚上发
--【拾叁】--:
真的假的,哪里来的小道消息今晚要发新模型
--【拾肆】--:
哈哈哈哈哈哈,佬你真用上了还是假用上了,不要骗我哟~
--【拾伍】--:
同意
我感觉应该v4带来的应该是是理论性的研究更有价值
光v4这个模型的能力可能并不好
--【拾陆】--:
到现在还没来 洗洗睡吧 五一前该出来了吧
--【拾柒】--:
五月一有可能?毕竟参数已经出来了
V4 1.6T, V4-Lite 285B
Attention: DSA2 (NSA + DSA),
head-dim 512 Sparse MQA + SWA
MoE: Fused MoE Mega-Kernel with 6 active in 384 experts
Residual: Hyper-Connections
Optimizer: Muon
Pretrain context length: 32K
RL: GRPO with corrected KL
Final Context Length: 1M
Modality: Text only
--【拾捌】--:
嘶,确实 gpt 5.5 很值得期待哟,但是我是用网页端对于逻辑和推理还有表达要求比较高,目前用 gpt 的问题就是——它根本不说人话啊喂!!!
--【拾玖】--:
V4 是 1.6T 的话,是不是可以干翻 sonnet4.6 啊,嘻嘻
想问下各位佬有消息吗?不是我看说好像四月底 dsv4 要准备发了吗?感觉一直在测试啊。希望能够来个大的好不,真的要被 Claude 还有智谱恶心坏了。能不能今晚就发,拜托!!!
网友解答:--【壹】--:
原来是这样,从过年一直传到现在,嘶,不知道还要多久发。华为昇腾的芯片真的。。。可以吗?
--【贰】--:
今晚不要睡 大的要来了
image225×225 42.3 KB
--【叁】--:
今天还不发,大概率就要等五月了,ds大版本的模型更行好像没有周五发的
--【肆】--:
害,好吧,辛苦佬回答了,能不能大概 sonnet4.6 的水平啊,我就很满足了
--【伍】--:
不是已经发了吗,我都用上了,你们没叮到咚鸡吗?
--【陆】--:
哈哈哈哈,佬友你发的这个梗图好好笑哈哈。
--【柒】--:
大的要来了小助手,给我整笑了,佬友太有画面了
--【捌】--:
我反而觉得Deepseek v4也许会带来一些新的技术方案?
然后国内模型都有阶段性的提升?
(希望如此,个人观点及猜测)
--【玖】--:
其实我更期待 GPT 5.5
DeepSeek v4 我并不看好,我估计会凉
应为v4早都应该弄好了,只不过没发布
可是其他模型赶的太快了,v4可能还没发布就落后了
--【拾】--:
哇,看来佬更多的可能是从技术层面来看待,可惜我只是一个学生,目前还涉及的太少 hhh
--【拾壹】--:
是的,我期望的就是这个,我也不对v4抱什么立马就提升很大的想法,我更希望新的技术方案~
--【拾贰】--:
参考他们发布的套路,应该是五一发或者五一前一天晚上发
--【拾叁】--:
真的假的,哪里来的小道消息今晚要发新模型
--【拾肆】--:
哈哈哈哈哈哈,佬你真用上了还是假用上了,不要骗我哟~
--【拾伍】--:
同意
我感觉应该v4带来的应该是是理论性的研究更有价值
光v4这个模型的能力可能并不好
--【拾陆】--:
到现在还没来 洗洗睡吧 五一前该出来了吧
--【拾柒】--:
五月一有可能?毕竟参数已经出来了
V4 1.6T, V4-Lite 285B
Attention: DSA2 (NSA + DSA),
head-dim 512 Sparse MQA + SWA
MoE: Fused MoE Mega-Kernel with 6 active in 384 experts
Residual: Hyper-Connections
Optimizer: Muon
Pretrain context length: 32K
RL: GRPO with corrected KL
Final Context Length: 1M
Modality: Text only
--【拾捌】--:
嘶,确实 gpt 5.5 很值得期待哟,但是我是用网页端对于逻辑和推理还有表达要求比较高,目前用 gpt 的问题就是——它根本不说人话啊喂!!!
--【拾玖】--:
V4 是 1.6T 的话,是不是可以干翻 sonnet4.6 啊,嘻嘻

