MLの概念誤り発見
機械学習の前処理とデータ準備に関する以下の記述で、誤っているものはどれか。
A.欠損値(Missing Values)は削除するか、平均値・中央値で補完してから学習に使用する必要がある。
✓ この記述は正しい。欠損値処理は機械学習の重要な前処理ステップである。
B.カテゴリ変数は数値に変換(ワンホットエンコーディング等)してからモデルに入力する。
✓ この記述は正しい。多くの機械学習アルゴリズムは数値入力を要求する。
C.外れ値(Outliers)は常にすべて削除すべきである。データの本質的な異常を示す可能性があるため除去しない場合もある。
✓ この記述は正しい。外れ値は分析前に状況判断で対応する必要がある。
D.特徴量スケーリングはすべてのアルゴリズムで必須であり、0〜1または正規分布に変換する。← 正解
✓ 正解です。この記述が誤りで、スケーリングはすべてのアルゴリズムで必須ではない。決定木系は不要だが、距離ベース(SVM、k-means等)には必須である。
この問題のポイント
この記述が誤りで、スケーリングはすべてのアルゴリズムで必須ではない。決定木系は不要だが、距離ベース(SVM、k-means等)には必須である。
「MLの概念」の他の問題
IT・クラウド の関連資格
AWS Certified Cloud Practitioner(CLF-C02)
AWSクラウドの入門資格。クラウドの概念・AWSのコアサービス・セキュリティ・料金モデルを問う。
AWS Certified Solutions Architect - Associate(SAA-C03)
AWSでのシステム設計能力を問うアソシエイト資格。高可用性・セキュリティ・コスト最適化の設計が中心。
DP-900:Microsoft Azure Data Fundamentals
Azureのデータサービスの基礎を問うMicrosoft認定資格。リレーショナル/非リレーショナルデータ、分析ワークロード、コアのデータ概念を扱う。