如何通过AI达人创造营第二期文章深入理解textCNN模型核心？

2026-05-07 17:291阅读0评论SEO教程

内容介绍
文章标签
相关推荐

本文共计776个文字，预计阅读时间需要4分钟。

相关专题内容，直接输出结果：

叠加上偏置b,在使用激活函数f激活, 得到所需的特征。公式如下：

具体卷积计算参考博客文本分类算法TextCNN原理详解（一）

对于多通道（channel）的说明

在CNN 中常常会提到一个词channel, 图三中深红矩阵与浅红矩阵便构成了两个channel 统称一个卷积核, 从这个图中也可以看出每个channel 不必严格一样, 每个4 * 5 矩阵与输入矩阵做一次卷积操作得到一个feature map. 在计算机视觉中，由于彩色图像存在 R, G, B 三种颜色, 每个颜色便代表一种channel。

根据原论文作者的描述, 一开始引入channel 是希望防止过拟合(通过保证学习到的vectors 不要偏离输入太多)来在小数据集合获得比单channel更好的表现，后来发现其实直接使用正则化效果更好。

不过使用多channel 相比与单channel, 每个channel 可以使用不同的word embedding, 比如可以在no-static(梯度可以反向传播) 的channel 来fine tune 词向量，让词向量更加适用于当前的训练。

对于channel在textCNN 是否有用, 从论文的实验结果来看多channels并没有明显提升模型的分类能力, 七个数据集上的五个数据集单channel 的textCNN 表现都要优于多channels的textCNN。

最大池化（max-pooling）

得到feamap = [1,1,2] 后, 从中选取一个最大值[2] 作为输出, 便是max-pooling。max-pooling 在保持主要特征的情况下, 大大降低了参数的数目, 从图五中可以看出 feature map 从三维变成了一维, 好处有如下两点:

1、降低了过拟合的风险, feature map = [1, 1, 2] 或者[1, 0, 2] 最后的输出都是[2], 表明开始的输入即使有轻微变形, 也不影响最后的识别。

2、参数减少, 进一步加速计算。

pooling 本身无法带来平移不变性(图片有个字母A, 这个字母A 无论出现在图片的哪个位置, 在CNN的网络中都可以识别出来)，卷积核的权值共享才能.

max-pooling的原理主要是从多个值中取一个最大值，做不到这一点。cnn 能够做到平移不变性，是因为在滑动卷积核的时候，使用的卷积核权值是保持固定的(权值共享), 假设这个卷积核被训练的就能识别字母A, 当这个卷积核在整张图片上滑动的时候，当然可以把整张图片的A都识别出来。

（三）优化与正则化

池化层后面加上全连接层和SoftMax层做分类任务，得到各个类别比如 label 为1 的概率以及label 为-1的概率。同时防止过拟合，一般会添加L2和Dropout正则化方法。最后整体使用梯度法进行参数的更新模型的优化。

标签：Git AI cos red upscale

本文共计776个文字，预计阅读时间需要4分钟。

相关专题内容，直接输出结果：

叠加上偏置b,在使用激活函数f激活, 得到所需的特征。公式如下：

具体卷积计算参考博客文本分类算法TextCNN原理详解（一）

对于多通道（channel）的说明

最大池化（max-pooling）

1、降低了过拟合的风险, feature map = [1, 1, 2] 或者[1, 0, 2] 最后的输出都是[2], 表明开始的输入即使有轻微变形, 也不影响最后的识别。

2、参数减少, 进一步加速计算。

pooling 本身无法带来平移不变性(图片有个字母A, 这个字母A 无论出现在图片的哪个位置, 在CNN的网络中都可以识别出来)，卷积核的权值共享才能.

（三）优化与正则化

标签：Git AI cos red upscale

对于多通道（channel）的说明

最大池化（max-pooling）

（三）优化与正则化

相关推荐

对于多通道（channel）的说明

最大池化（max-pooling）

（三）优化与正则化

相关推荐