深層学習(ディープラーニング)応用問題

RNN(再帰型ニューラルネットワーク)で長期の依存関係をモデル化する必要がある場合、標準的なRNNではなくLSTMやGRUを採用する理由は何か?

A.計算コストが大幅に削減されるため
✗ LSTMやGRUは標準的なRNNよりもゲート機構を持つため、計算コストはむしろ増加します。
B.勾配消失・爆発問題を軽減し、長期の情報伝播を可能にするため← 正解
✓ 正解です。LSTMのセルステートとゲート機構、またはGRUの更新ゲートは、勾配の流れを制御し、長期依存を学習可能にします。
C.活性化関数がより多くの非線形性を獲得するため
✗ 非線形性の増加が長期依存性の解決につながるわけではなく、むしろゲート機構による勾配制御が重要です。
D.モデルのパラメータ総数が確実に減少するため
✗ LSTMやGRUはゲートユニットにより標準的なRNNより多くのパラメータを持つため、この説明は誤りです。

G検定(深層学習・ジェネラリスト検定) の問題一覧