MLの概念定義

機械学習における「過学習(Overfitting)」の定義として最も適切なものはどれか?

A.モデルが訓練データに対して過度に適合し、未知のデータに対する予測性能が低下する現象← 正解
✓ 正解です。過学習は訓練データのノイズまで学習してしまい、一般化性能が低下する状況を指します。
B.訓練データセットのサイズが検証データセットよりも小さいために生じるモデルの性能低下
✗ これはデータセットの分割比率の問題であり、過学習の定義ではありません。過学習はデータ量に関わらず発生します。
C.複数のモデルを組み合わせて予測精度を向上させる機械学習の手法
✗ これはアンサンブル学習の説明です。過学習とは異なる概念です。
D.モデルのパラメータ数が訓練データのサンプル数よりも多い状態
✗ パラメータ数とサンプル数の関係は過学習の原因の一つですが、過学習そのものの定義ではありません。

この問題のポイント

過学習は訓練データのノイズまで学習してしまい、一般化性能が低下する状況を指します。

AI-900:Microsoft Azure AI Fundamentals の問題一覧