deepseek v4 碎碎念
- 内容介绍
- 文章标签
- 相关推荐
问题描述:
--【壹】--:
1、CSA和HCA两种sparse attention
2、mHC
3、Muon优化器
4、GRPO+OPD
想问一下这次的engram去哪里了,没办法scale up?
网友解答:--【壹】--:
是啊,寄予厚望的engram呢?还把这个当成从计算到存储的ai范式转移来着
问题描述:
--【壹】--:
1、CSA和HCA两种sparse attention
2、mHC
3、Muon优化器
4、GRPO+OPD
想问一下这次的engram去哪里了,没办法scale up?
网友解答:--【壹】--:
是啊,寄予厚望的engram呢?还把这个当成从计算到存储的ai范式转移来着

