我去,DeepSeekv4 真的发布了
- 内容介绍
- 文章标签
- 相关推荐
问题描述:
--【壹】--:
DeepSeek-V4 开创了一种全新的注意力机制,在 token 维度进行压缩,结合 DSA 稀疏注意力(DeepSeek Sparse Attention),实现了全球领先的长上下文能力,并且相比于传统方法大幅降低了对计算和显存的需求
1000007443.png2793×1919 771 KB
1000007442.png2560×496 158 KB
1000007444.png2531×697 152 KB
--【壹】--:
难道不是佬来晚了吗,早上到处都是v4消息
问题描述:
--【壹】--:
DeepSeek-V4 开创了一种全新的注意力机制,在 token 维度进行压缩,结合 DSA 稀疏注意力(DeepSeek Sparse Attention),实现了全球领先的长上下文能力,并且相比于传统方法大幅降低了对计算和显存的需求
1000007443.png2793×1919 771 KB
1000007442.png2560×496 158 KB
1000007444.png2531×697 152 KB
--【壹】--:
难道不是佬来晚了吗,早上到处都是v4消息

