0%

CS231n笔记14 - 卷积神经网络 - 卷积和池化

Fully Connected Layer 全连接层

32 \( \times \) 32\(\times\)3 image \(\to\) stretch to 3072\(\times\)1

Convolution Layer 卷积层

卷积层与全连接层的主要差别在于前者可以保全 空间结构 (Spatial Structure)。处理一张 32 \( \times \) 32\(\times\)3 的图片,不同于全连接层中将其展开为一维的长向量作为输入,我们在卷积层直接将图片的三维的结构输入,这样我们就可以保持图片的结构。

接下来,我们的权重是一些小的卷积核,例如 5 \( \times \) 5 \(\times\) 3 的大小,我们将把这个卷积核在整个图像上滑动,并计算出在每一个空间定位(Spatial Location)时的 Dot Product。

首先,我们采用的卷积核总是会将输入量扩展至完全(extend the Full Depth of the input volume)。它们都是很小的空间区域,这里是 5 \( \times \) 5 而不是输入空间的全部大小 32 \( \times \) 32,但是他们通常会遍历所有的RGB通道 ,所以这里我们采用的卷积核的大小为 5 \( \times \) 5 \(\times\) 3 。