AIと機械学習の基礎概念誤り発見

データの前処理(Preprocessing)に関する以下の記述のうち、誤っているものはどれか?

A.正規化(Normalization)は、特徴量の値を一定の範囲(例:0〜1)にスケーリングする処理であり、学習の安定化に寄与する。
✓ この記述は正しい。正規化により各特徴量のスケールを揃えることで、勾配降下法などの最適化が安定しやすくなる。
B.欠損値の処理には、該当レコードの削除や平均値・中央値による補完など複数のアプローチが存在する。
✓ この記述は正しい。欠損値処理は機械学習の前処理の重要なステップであり、削除・補完・予測補完など複数の方法がある。
C.データ拡張(Data Augmentation)は、既存データに変換を加えて訓練データを人工的に増やす手法であり、過学習の抑制に効果がある。
✓ この記述は正しい。Data Augmentationは画像の反転や回転などの変換でデータを増やし、モデルの汎化性能向上に役立つ。
D.テストデータのスケーリングには、テストデータ自身の統計量(平均・標準偏差)を使って正規化を行うべきである。← 正解
✓ 正解です。この記述が誤りで、正しくはテストデータのスケーリングは訓練データの統計量を使って行うべきであり、データリークを防ぐ必要がある。

AWS Certified AI Practitioner(AIF-C01) の問題一覧