如何获取ConvNeXt在飞桨上的预训练权重文件?
- 内容介绍
- 文章标签
- 相关推荐
本文共计1595个文字,预计阅读时间需要7分钟。
相关专题:
ConvNeXt
模型文件请见ConvNeXt.py, 下面说一下PyTorch模型转换PaddlePaddle模型的注意事项。
- 线性层PyTorch与PaddlePaddle的权重转换需要转置一下
- DropPath层需要自定义。我是参考了这篇文章 PiT:结合池化层的视觉 Transformer 网络
- PaddlePaddle在涉及维度的参数时,多用axis,PyTorch则是dim
- 有时需要自定义参数,PaddlePaddle的API在这里
- PaddlePaddle无permute,而是采用了transpose
- 其他简单的API映射请见这里
在这个py文件的第134和135行,给weight和bias乘了一个1,也就是没有做什么处理,这个是PyTorch的写法,PaddlePaddle的写法我还不会,麻烦知道的大佬回复一下。
权重
这里介绍一下本次精度验证的权重文件,总共有5个,分别代表了不同大小和版本的ConvNeXt。 首先来总览一下。
本文共计1595个文字,预计阅读时间需要7分钟。
相关专题:
ConvNeXt
模型文件请见ConvNeXt.py, 下面说一下PyTorch模型转换PaddlePaddle模型的注意事项。
- 线性层PyTorch与PaddlePaddle的权重转换需要转置一下
- DropPath层需要自定义。我是参考了这篇文章 PiT:结合池化层的视觉 Transformer 网络
- PaddlePaddle在涉及维度的参数时,多用axis,PyTorch则是dim
- 有时需要自定义参数,PaddlePaddle的API在这里
- PaddlePaddle无permute,而是采用了transpose
- 其他简单的API映射请见这里
在这个py文件的第134和135行,给weight和bias乘了一个1,也就是没有做什么处理,这个是PyTorch的写法,PaddlePaddle的写法我还不会,麻烦知道的大佬回复一下。
权重
这里介绍一下本次精度验证的权重文件,总共有5个,分别代表了不同大小和版本的ConvNeXt。 首先来总览一下。

