AIと機械学習の基礎概念応用問題

ニューラルネットワークの学習において、学習率(Learning Rate)を非常に大きな値に設定した場合、どのような問題が発生しやすいか?

A.損失関数の最小値に収束するまでの時間が長くなる
✗ 学習率が大きい場合は収束が速くなる可能性がありますが、むしろ発散するリスクが問題です。
B.モデルが複雑になりすぎて過学習が発生する
✗ 過学習は主にモデルの複雑さやデータ量に起因し、学習率の大小とは直接関係しません。
C.勾配降下法が最適解を飛び越えてしまい、損失が発散する← 正解
✓ 正解です。学習率が大きすぎると、最適解を大幅に超えてパラメータが更新され、損失が収束せず発散します。
D.モデルのパラメータが更新されなくなり、学習が停止する
✗ パラメータが更新されなくなるのは学習率が0または極めて小さい場合に起こりやすい問題です。

AWS Certified AI Practitioner(AIF-C01) の問題一覧