深層学習応用

LSTM(長短期記憶)ネットワークにおいて、忘却ゲート(Forget Gate)の重みが訓練を通じてゼロに近づいてしまう場合、このモデルの振る舞いとして最も適切な説明はどれか?

A.セル状態の情報が蓄積され続け、長期記憶が過度に強化される
✗ 忘却ゲートがゼロに近づくと過去情報を保持できなくなるため、情報の蓄積は生じない。むしろ逆である。
B.セル状態から過去の情報がほぼ全て削除され、直近の入力情報のみを処理するようになる← 正解
✓ 正解です。忘却ゲートがゼロに近づくと、セル状態が乗算される値が約0になり、過去のセル状態がリセットされるため、直近入力の影響のみが強くなります。
C.入力ゲートと出力ゲートが自動調整され、モデルが自己補正する
✗ 他のゲートが自動補正される仕組みはLSTMにはなく、各ゲートは独立して最適化される。
D.勾配消失問題が再発し、訓練が完全に停滞する
✗ LSTMは設計上、忘却ゲートの問題があっても勾配消失を完全には避けられないが、訓練が即座に停滞するわけではない。

この問題のポイント

忘却ゲートがゼロに近づくと、セル状態が乗算される値が約0になり、過去のセル状態がリセットされるため、直近入力の影響のみが強くなります。

AI-900:Microsoft Azure AI Fundamentals の問題一覧