RNN（再帰型ニューラルネットワーク）で長期の依存関係をモデル化する必要がある場合、標準的… | G検定（深層学習・ジェネラリスト検定）

深層学習（ディープラーニング）応用

RNN（再帰型ニューラルネットワーク）で長期の依存関係をモデル化する必要がある場合、標準的なRNNではなくLSTMやGRUを採用する理由は何か？

A.計算コストが大幅に削減されるため

✗ LSTMやGRUは標準的なRNNよりもゲート機構を持つため、計算コストはむしろ増加します。

B.勾配消失・爆発問題を軽減し、長期の情報伝播を可能にするため← 正解

✓ 正解です。LSTMのセルステートとゲート機構、またはGRUの更新ゲートは、勾配の流れを制御し、長期依存を学習可能にします。

C.活性化関数がより多くの非線形性を獲得するため

✗ 非線形性の増加が長期依存性の解決につながるわけではなく、むしろゲート機構による勾配制御が重要です。

D.モデルのパラメータ総数が確実に減少するため

✗ LSTMやGRUはゲートユニットにより標準的なRNNより多くのパラメータを持つため、この説明は誤りです。

この問題のポイント

LSTMのセルステートとゲート機構、またはGRUの更新ゲートは、勾配の流れを制御し、長期依存を学習可能にします。

「深層学習（ディープラーニング）」の他の問題

AWS Certified AI Practitioner（AIF-C01）

AWSにおけるAI・ML・生成AIサービスの基礎知識を問う新資格。AIの概念からAWSのAIサービスまで幅広く出題。