MLの概念誤り発見

機械学習の前処理とデータ準備に関する以下の記述で、誤っているものはどれか。

A.欠損値(Missing Values)は削除するか、平均値・中央値で補完してから学習に使用する必要がある。
✓ この記述は正しい。欠損値処理は機械学習の重要な前処理ステップである。
B.カテゴリ変数は数値に変換(ワンホットエンコーディング等)してからモデルに入力する。
✓ この記述は正しい。多くの機械学習アルゴリズムは数値入力を要求する。
C.外れ値(Outliers)は常にすべて削除すべきである。データの本質的な異常を示す可能性があるため除去しない場合もある。
✓ この記述は正しい。外れ値は分析前に状況判断で対応する必要がある。
D.特徴量スケーリングはすべてのアルゴリズムで必須であり、0〜1または正規分布に変換する。← 正解
✓ 正解です。この記述が誤りで、スケーリングはすべてのアルゴリズムで必須ではない。決定木系は不要だが、距離ベース(SVM、k-means等)には必須である。

この問題のポイント

この記述が誤りで、スケーリングはすべてのアルゴリズムで必須ではない。決定木系は不要だが、距離ベース(SVM、k-means等)には必須である。

AI-900:Microsoft Azure AI Fundamentals の問題一覧