データの前処理（Preprocessing）に関する以下の記述のうち、誤っているものはどれ… | AWS Certified AI Practitioner（AIF-C01）

AIと機械学習の基礎概念誤り発見

データの前処理（Preprocessing）に関する以下の記述のうち、誤っているものはどれか？

A.正規化（Normalization）は、特徴量の値を一定の範囲（例：0〜1）にスケーリングする処理であり、学習の安定化に寄与する。

✓ この記述は正しい。正規化により各特徴量のスケールを揃えることで、勾配降下法などの最適化が安定しやすくなる。

B.欠損値の処理には、該当レコードの削除や平均値・中央値による補完など複数のアプローチが存在する。

✓ この記述は正しい。欠損値処理は機械学習の前処理の重要なステップであり、削除・補完・予測補完など複数の方法がある。

C.データ拡張（Data Augmentation）は、既存データに変換を加えて訓練データを人工的に増やす手法であり、過学習の抑制に効果がある。

✓ この記述は正しい。Data Augmentationは画像の反転や回転などの変換でデータを増やし、モデルの汎化性能向上に役立つ。

D.テストデータのスケーリングには、テストデータ自身の統計量（平均・標準偏差）を使って正規化を行うべきである。← 正解

✓ 正解です。この記述が誤りで、正しくはテストデータのスケーリングは訓練データの統計量を使って行うべきであり、データリークを防ぐ必要がある。

この問題のポイント

この記述が誤りで、正しくはテストデータのスケーリングは訓練データの統計量を使って行うべきであり、データリークを防ぐ必要がある。

「AIと機械学習の基礎概念」の他の問題

G検定（深層学習・ジェネラリスト検定）

日本ディープラーニング協会（JDLA）が主催するAI・深層学習の基礎資格。AIの概念・機械学習・ディープラーニング・生成AIの基礎を問う。2025-2026年に受験者急増中。