# CNN 实战 以前面提到的 5×5 输入矩阵为例,CNN 的输入层由 25 个神经元(5×5)组成,其任务是获取与每个像素对应的输入值并将其转移到下一层。 在多层网络中,输入层中所有神经元的输出将连接到隐藏层(完全连接层)中的每个神经元。然而,在 CNN 网络中,上面定义的连接方案和我们要描述的卷积层是显着不同的。正如您可能猜到的,这是层的主要类型:在 CNN 中使用这些层中的一个或多个是必不可少的。 在卷积层中,每个神经元连接到输入区域的某个区域,称为感受野。例如,使用 3×3 内核滤波器,每个神经元将具有偏置并且 9 个权重(3×3)连接到单个感受野。为了有效地识别图像,我们需要将各种不同的内核过滤器应用于相同的感受野,因为每个过滤器应该识别来自图像的不同特征。识别相同特征的神经元集定义了单个特征映射。 下图显示了运行中的 CNN 架构:28×28 输入图像将由一个由 28x28x32 特征映射组成的卷积层进行分析。该图还显示了一个感受野和一个 3×3 内核过滤器: ![CNNs in action](img/B09698_04_05.jpg) 图 5:CNN 正在运行中 CNN 可以由级联连接的若干卷积层组成。每个卷积层的输出是一组特征映射(每个都由单个内核过滤器生成)。这些矩阵中的每一个都定义了将由下一层使用的新输入。 通常,在 CNN 中,每个神经元产生高达激活阈值的输出,该激活阈值与输入成比例并且不受限制。 CNN 还使用位于卷积层之后的池化层。池化层将卷积区域划分为子区域。然后,池化层选择单个代表值(最大池化或平均池化)以减少后续层的计算时间并增加特征相对于其空间位置的稳健性。卷积网络的最后一层通常是完全连接的网络,具有用于输出层的 softmax 激活函数。在接下来的几节中,将详细分析最重要的 CNN 的架构。