機械学習の評価誤り発見

機械学習モデルの交差検証(クロスバリデーション)と過学習に関する以下の記述で、誤っているものはどれか?

A.k分割交差検証では、データをk個の部分に分割し、各回でk-1個を訓練データ、1個をテストデータとして評価を繰り返す。
✓ この記述は正しい。k分割交差検証の基本的な仕組みが正確に説明されている。
B.交差検証を使用する主な目的は、モデルの汎化性能をより信頼性高く評価することであり、データサイズが限られた環境で有効である。
✓ この記述は正しい。交差検証はデータの効率的活用と汎化性能評価に有効である。
C.過学習(Overfitting)とは、モデルがテストデータの特性に過度に適応し、訓練データには高い精度を示すが、新規データへの予測精度が低くなる現象である。← 正解
✓ 正解です。この記述が誤りで、過学習は「訓練データの特性に過度に適応」することである。説明文で「テストデータ」とあるのは間違いで、正しくは「訓練データ」に対する過度な適応である。
D.正則化(Regularization)はモデルの複雑性にペナルティを加え、過学習を防ぐ手法である。
✓ この記述は正しい。L1正則化やL2正則化などが過学習を防ぐ標準的な手法である。

この問題のポイント

この記述が誤りで、過学習は「訓練データの特性に過度に適応」することである。説明文で「テストデータ」とあるのは間違いで、正しくは「訓練データ」に対する過度な適応である。

AI-900:Microsoft Azure AI Fundamentals の問題一覧