深層学習応用

リカレントニューラルネットワーク(RNN)を用いた時系列予測モデルで、シーケンスの長さが急激に増加した場合、以下のうち最初に顕著になる問題はどれか?

A.出力層の活性化関数が飽和し、予測精度が急低下する
✗ 活性化関数の飽和は勾配消失の一部の原因だが、シーケンス長増加の直接的な主要問題ではない。
B.逆伝播時に勾配が指数関数的に減衰し、遠い過去の情報が学習されなくなる← 正解
✓ 正解です。RNNでは長いシーケンスにおいて逆伝播で繰り返し乗算が起こり、勾配が指数的に減衰する(勾配消失)ため、初期時刻の情報が失われます。
C.訓練データのバッチサイズが自動的に縮小され、勾配推定の分散が増加する
✗ バッチサイズは自動調整されず、シーケンス長とは独立した訓練パラメータである。
D.入力層のノード数が制限され、系列全体を処理できなくなる
✗ 入力層のノード数はシーケンス長に応じて変わらず、RNNは可変長シーケンスを処理可能に設計されている。

この問題のポイント

RNNでは長いシーケンスにおいて逆伝播で繰り返し乗算が起こり、勾配が指数的に減衰する(勾配消失)ため、初期時刻の情報が失われます。

AI-900:Microsoft Azure AI Fundamentals の問題一覧