EdgeViTs复现的轻量级Vision-Transformer如何实现?
- 内容介绍
- 文章标签
- 相关推荐
本文共计295个文字,预计阅读时间需要2分钟。
相关专题:
- Local aggregation:仅集成来自局部近似Token信号的局部聚合
- Global sparse attention:建模一组代表性Token之间的长期关系,其中每个Token都被视为一个局部窗口的代表;
- Local propagation:将委托学习到的全局上下文信息扩散到具有相同窗口的非代表Token。
- Local aggregation
对于每个Token,利用Depth-wise和Point-wise卷积在大小为k×k的局部窗口中聚合信息(图3(a))。
本文共计295个文字,预计阅读时间需要2分钟。
相关专题:
- Local aggregation:仅集成来自局部近似Token信号的局部聚合
- Global sparse attention:建模一组代表性Token之间的长期关系,其中每个Token都被视为一个局部窗口的代表;
- Local propagation:将委托学习到的全局上下文信息扩散到具有相同窗口的非代表Token。
- Local aggregation
对于每个Token,利用Depth-wise和Point-wise卷积在大小为k×k的局部窗口中聚合信息(图3(a))。

