convolutional layerについて
上のサイトなどを見ていてわからないところがあったので質問します。
# name size parameters
--- -------- ------------------------- ------------------------
0 input 1x28x28 0
1 conv2d1 (28-(5-1))=24 -> 32x24x24 (5*5*1+1)*32 = 832
2 maxpool1 32x12x12 0
3 conv2d2 (12-(3-1))=10 -> 32x10x10 (3*3*32+1)*32 = 9'248
4 maxpool2 32x5x5 0
5 dense 256 (32*5*5+1)*256 = 205'056
6 output 10 (256+1)*10 = 2'570
上のようなCNNモデルがあった時、最初のconv2d1の層で32個のフィルターを用意していますよね?
これはそれぞれ異なる32種類の5*5の重み行列という理解でした。
これに対してpooling層をかませることで、32*12*12の出力になることまではわかります。
(12*12が32枚あるようなイメージ)
ただ、conv2d2でこの出力にまた32個の重み行列フィルターをかけると、さらに32倍になってしまっておかしいような気がするのですが、合ってますか?
よろしくお願いします。