deepseek v4 碎碎念

2026-04-29 10:041阅读0评论SEO基础
  • 内容介绍
  • 文章标签
  • 相关推荐
问题描述:

1、CSA和HCA两种sparse attention
2、mHC
3、Muon优化器
4、GRPO+OPD

想问一下这次的engram去哪里了,没办法scale up?

网友解答:
--【壹】--:

是啊,寄予厚望的engram呢?还把这个当成从计算到存储的ai范式转移来着