教師なし学習比較
変数の標準化(standardization)と正規化(normalization)の主な違いは何か?
A.標準化はZ値に変換(平均0、標準偏差1)し、正規化は値を[0,1]に縮小する。どちらもクラスタリングの前処理として用いられる← 正解
✓ 正解です。標準化(Z-score)はμ=0、σ=1に変換し、正規化(Min-Max)は[0,1]範囲に縮小します。両者はクラスタリング前処理で重要です。
B.標準化は外れ値に強く、正規化は外れ値に敏感である
✗ 逆です。外れ値がある場合、正規化は最大値に影響されやすく、標準化が相対的にロバストです。
C.標準化は正規分布を仮定し、正規化は均等分布を仮定する
✗ 特定の分布を仮定しません。標準化は分布形状によらず適用でき、正規化も同様です。
D.正規化は教師あり学習のみに用いられ、標準化は教師なし学習のみに用いられる
✗ 誤りです。両者とも教師あり・なし両方で広く使用されます。
この問題のポイント
標準化(Z-score)はμ=0、σ=1に変換し、正規化(Min-Max)は[0,1]範囲に縮小します。両者はクラスタリング前処理で重要です。
「教師なし学習」の他の問題
k-meansクラスタリングで「最適なクラスタ数K」を決める一般的な方法はどれか?PCA(主成分分析)の目的として最も適切なものはどれか?k-meansクラスタリングを実行したとき、初期クラスタ中心をランダムに選び直して再度実行すると、全く異なるクラスタ結果…階層的クラスタリング(凝集型)を用いて大規模なテキストドキュメント群をクラスタリングしたところ、途中で計算が極めて遅くな…DBSCAN(密度ベースのクラスタリング)でε(近傍半径)パラメータを0.5から1.5に増加させたとき、一般的にどのよう…複数の異なる教師なし学習アルゴリズム(k-means、DBSCANと階層的クラスタリング)を同じデータセットに適用したと…
IT・クラウド の関連資格
AWS Certified Cloud Practitioner(CLF-C02)
AWSクラウドの入門資格。クラウドの概念・AWSのコアサービス・セキュリティ・料金モデルを問う。
AWS Certified Solutions Architect - Associate(SAA-C03)
AWSでのシステム設計能力を問うアソシエイト資格。高可用性・セキュリティ・コスト最適化の設計が中心。
DP-900:Microsoft Azure Data Fundamentals
Azureのデータサービスの基礎を問うMicrosoft認定資格。リレーショナル/非リレーショナルデータ、分析ワークロード、コアのデータ概念を扱う。