教師なし学習誤り発見
教師なし学習の手法に関する以下の記述のうち、誤っているものはどれか。
A.階層的クラスタリングは、デンドログラムを生成することで、異なるクラスタ数での結果を可視化できる。
✓ この記述は正しい。階層的クラスタリングは樹形図状のデンドログラムを生成し、異なる段階でのクラスタ構造を確認できる。
B.DBSCANアルゴリズムは、クラスタ数を事前に指定する必要があり、密度ベースでクラスタを形成する。← 正解
✓ 正解です。DBSCANはクラスタ数を事前に指定せず、密度パラメータ(eps、min_samples)で自動的にクラスタを形成する。クラスタ数を指定するのはk-meansなどである。
C.k-meansアルゴリズムは、初期中心の選択によって最終結果が異なる可能性があるため、複数回の実行が推奨される。
✓ この記述は正しい。k-meansは初期中心のランダム選択に依存し、複数回実行してベストな結果を選ぶ方法が一般的である。
D.ガウス混合モデル(GMM)は、確率的なアプローチでクラスタリングを行い、各サンプルが複数のクラスタに属する確度を計算できる。
✓ この記述は正しい。GMMは確率モデルで、各サンプルが各クラスタに属する事後確率を算出し、曖昧な割り当てに対応できる。
この問題のポイント
DBSCANはクラスタ数を事前に指定せず、密度パラメータ(eps、min_samples)で自動的にクラスタを形成する。クラスタ数を指定するのはk-meansなどである。
「教師なし学習」の他の問題
k-meansクラスタリングで「最適なクラスタ数K」を決める一般的な方法はどれか?PCA(主成分分析)の目的として最も適切なものはどれか?k-meansクラスタリングを実行したとき、初期クラスタ中心をランダムに選び直して再度実行すると、全く異なるクラスタ結果…階層的クラスタリング(凝集型)を用いて大規模なテキストドキュメント群をクラスタリングしたところ、途中で計算が極めて遅くな…DBSCAN(密度ベースのクラスタリング)でε(近傍半径)パラメータを0.5から1.5に増加させたとき、一般的にどのよう…複数の異なる教師なし学習アルゴリズム(k-means、DBSCANと階層的クラスタリング)を同じデータセットに適用したと…
IT・クラウド の関連資格
AWS Certified Cloud Practitioner(CLF-C02)
AWSクラウドの入門資格。クラウドの概念・AWSのコアサービス・セキュリティ・料金モデルを問う。
AWS Certified Solutions Architect - Associate(SAA-C03)
AWSでのシステム設計能力を問うアソシエイト資格。高可用性・セキュリティ・コスト最適化の設計が中心。
DP-900:Microsoft Azure Data Fundamentals
Azureのデータサービスの基礎を問うMicrosoft認定資格。リレーショナル/非リレーショナルデータ、分析ワークロード、コアのデータ概念を扱う。