深層学習定義

RNNの主な制限事項として知られる「勾配消失問題」とはどのような現象か?

A.訓練時間が長くなるにつれて、モデルの処理速度が指数関数的に低下する
✗ これはハードウェアまたはデータ量の問題です。勾配消失とは関連がありません。
B.逆伝播時に勾配が連鎖的に乗算され、深い層では勾配がほぼ0に近づき、重みの更新が停止する← 正解
✓ 正解です。特にRNNで深い時系列を処理時、逆伝播で勾配が減衰し、初期層の重み更新ができなくなる現象です。
C.ネットワークの層数を増やすと、各層の出力が同じ値に収束してしまう
✗ これはニューロンの出力飽和による別の問題です。勾配消失とは異なります。
D.訓練データの標準偏差が大きいと、勾配計算が不安定になり、ランダム値になる
✗ 入力データの標準偏差は勾配消失の直接的な原因ではありません。

この問題のポイント

特にRNNで深い時系列を処理時、逆伝播で勾配が減衰し、初期層の重み更新ができなくなる現象です。

AI-900:Microsoft Azure AI Fundamentals の問題一覧