教師なし学習比較
k-meansクラスタリングとGaussian Mixture Model(GMM)の主な違いについて、最も適切なものはどれか?
A.GMMは各点がすべてのクラスタに属する確率を出力するが、k-meansは各点を1つのクラスタに硬く割り当てる← 正解
✓ 正解です。k-meansはハード割り当て(hard assignment)で、GMMはソフト割り当て(soft assignment:確率分布)を使います。
B.k-meansはより複雑な統計モデルで、GMMはより単純な距離ベースモデルである
✗ 逆です。GMMは確率的統計モデルで複雑であり、k-meansはより単純です。
C.GMMは必ず事前にクラスタ数を指定する必要があるが、k-meansは自動決定可能である
✗ 両者とも事前にK(クラスタ数)を指定する必要があります。
D.k-meansはGMMより計算量が多く、大規模データに不向きである
✗ 逆です。k-meansはO(nk)で高速で、GMMはEM アルゴリズムでO(nkd)かかります。
この問題のポイント
k-meansはハード割り当て(hard assignment)で、GMMはソフト割り当て(soft assignment:確率分布)を使います。
「教師なし学習」の他の問題
k-meansクラスタリングで「最適なクラスタ数K」を決める一般的な方法はどれか?PCA(主成分分析)の目的として最も適切なものはどれか?k-meansクラスタリングを実行したとき、初期クラスタ中心をランダムに選び直して再度実行すると、全く異なるクラスタ結果…階層的クラスタリング(凝集型)を用いて大規模なテキストドキュメント群をクラスタリングしたところ、途中で計算が極めて遅くな…DBSCAN(密度ベースのクラスタリング)でε(近傍半径)パラメータを0.5から1.5に増加させたとき、一般的にどのよう…複数の異なる教師なし学習アルゴリズム(k-means、DBSCANと階層的クラスタリング)を同じデータセットに適用したと…
IT・クラウド の関連資格
AWS Certified Cloud Practitioner(CLF-C02)
AWSクラウドの入門資格。クラウドの概念・AWSのコアサービス・セキュリティ・料金モデルを問う。
AWS Certified Solutions Architect - Associate(SAA-C03)
AWSでのシステム設計能力を問うアソシエイト資格。高可用性・セキュリティ・コスト最適化の設計が中心。
DP-900:Microsoft Azure Data Fundamentals
Azureのデータサービスの基礎を問うMicrosoft認定資格。リレーショナル/非リレーショナルデータ、分析ワークロード、コアのデータ概念を扱う。