教師なし学習計算
あるデータセットをk-meansで分析する際、エルボー法を用いてクラスタ数Kを決定します。クラスタ数Kに対する総ウィズイン・クラスタ平方和(WCSS)が、K=3で125、K=4で98、K=5で85、K=6で82の場合、最適なクラスタ数として最も適切なものはどれか?
A.K=3
✗ K=3では減少量が大きすぎます。K=3→4の減少量(27)と比較して、K=4→5の減少量(13)で減速が見られています。
B.K=4← 正解
✓ 正解です。K=3→4で27の減少、K=4→5で13の減少と減速が始まり、エルボー(肘)がK=4付近に形成されています。
C.K=5
✗ K=5では追加クラスタが必要なほどの改善がありません。K=5→6の減少は3のみで、ほぼプラトーに達しています。
D.K=6
✗ K=6では過度なクラスタ数です。K=5→6での改善がわずか3であり、さらなるクラスタ追加は過学習のリスクがあります。
この問題のポイント
K=3→4で27の減少、K=4→5で13の減少と減速が始まり、エルボー(肘)がK=4付近に形成されています。
「教師なし学習」の他の問題
k-meansクラスタリングで「最適なクラスタ数K」を決める一般的な方法はどれか?PCA(主成分分析)の目的として最も適切なものはどれか?k-meansクラスタリングを実行したとき、初期クラスタ中心をランダムに選び直して再度実行すると、全く異なるクラスタ結果…階層的クラスタリング(凝集型)を用いて大規模なテキストドキュメント群をクラスタリングしたところ、途中で計算が極めて遅くな…DBSCAN(密度ベースのクラスタリング)でε(近傍半径)パラメータを0.5から1.5に増加させたとき、一般的にどのよう…複数の異なる教師なし学習アルゴリズム(k-means、DBSCANと階層的クラスタリング)を同じデータセットに適用したと…
IT・クラウド の関連資格
AWS Certified Cloud Practitioner(CLF-C02)
AWSクラウドの入門資格。クラウドの概念・AWSのコアサービス・セキュリティ・料金モデルを問う。
AWS Certified Solutions Architect - Associate(SAA-C03)
AWSでのシステム設計能力を問うアソシエイト資格。高可用性・セキュリティ・コスト最適化の設計が中心。
DP-900:Microsoft Azure Data Fundamentals
Azureのデータサービスの基礎を問うMicrosoft認定資格。リレーショナル/非リレーショナルデータ、分析ワークロード、コアのデータ概念を扱う。