深層学習計算

畳み込みニューラルネットワーク(CNN)の畳み込み層において、入力画像のサイズが224×224ピクセル、カーネルサイズが3×3、ストライドが1、パディングが1の場合、出力特徴マップのサイズはいくらになるか?

A.224×224← 正解
✓ 正解です。出力サイズ=(224-3+2×1)/1+1=224となります。パディングによって入力サイズが保持されます。
B.222×222
✗ これはパディングなしの場合の計算です。出力サイズ=(224-3)/1+1=222になりますが、問題ではパディング=1が指定されています。
C.112×112
✗ これはストライド=2またはmax pooling層の出力サイズです。ストライド=1、パディング=1の場合は入力と同じサイズが保持されます。
D.226×226
✗ この値は逆向きの計算結果です。出力サイズが入力より大きくなることは、通常の畳み込み演算では起こりません。

この問題のポイント

出力サイズ=(224-3+2×1)/1+1=224となります。パディングによって入力サイズが保持されます。

AI-900:Microsoft Azure AI Fundamentals の問題一覧