AIの基礎誤り発見

データ準備と前処理に関する以下の記述のうち、誤っているものはどれか。

A.欠損値(Missing Values)は削除または補完する必要がある。
✓ この記述は正しい。欠損値の適切な処理はモデル構築の重要なステップである。
B.データの正規化(Normalization)は、異なるスケール範囲の特徴量を統一することで、モデル性能を改善する。
✓ この記述は正しい。正規化はスケーリング手法として機械学習で広く活用される。
C.外れ値(Outliers)は常に削除すべきであり、保持することは学習を損なわせる。← 正解
✓ 正解です。この記述が誤りです。外れ値には本物の異常(有用な情報)と測定誤差がある。無条件に削除するのではなく、原因を検証した上で判断すべき場合が多い。
D.カテゴリカル変数(Category Variables)は、ワンホットエンコーディングやラベルエンコーディングで数値化する。
✓ この記述は正しい。カテゴリカル変数の数値化は機械学習の標準的な前処理である。

この問題のポイント

この記述が誤りです。外れ値には本物の異常(有用な情報)と測定誤差がある。無条件に削除するのではなく、原因を検証した上で判断すべき場合が多い。

AI-900:Microsoft Azure AI Fundamentals の問題一覧