教師なし学習定義
DBSCAN(Density-Based Spatial Clustering of Applications with Noise)アルゴリズムの基本的な概念として最も正確なものはどれか?
A.クラスタ数を事前に指定せず、近傍データポイントの密度に基づいてグループを自動的に発見し、ノイズポイントを識別できる← 正解
✓ 正解です。DBSCANはクラスタ数を事前に指定せず、密度(Epsilon半径内のデータ点数)に基づいてクラスタを発見し、ノイズポイントを識別できます。
B.すべてのデータを必ずいずれかのクラスタに割り当てることを前提としている
✗ DBSCANの利点の一つは、密度の低い領域のポイントをノイズ・外れ値として分類できる点です。すべてをクラスタに割り当てません。
C.ユークリッド距離のみを使用して距離を測定する必要がある
✗ DBSCANはユークリッド距離以外の距離メトリクス(マンハッタン距離など)も使用でき、柔軟性があります。
D.各クラスタのサイズと形状が大きく異なる場合に固定パラメータで対応可能である
✗ 異なるサイズや形状のクラスタに対応するには、局所密度に応じてEpsilonパラメータを調整する必要があり、固定パラメータでは難しいです。
この問題のポイント
DBSCANはクラスタ数を事前に指定せず、密度(Epsilon半径内のデータ点数)に基づいてクラスタを発見し、ノイズポイントを識別できます。
「教師なし学習」の他の問題
k-meansクラスタリングで「最適なクラスタ数K」を決める一般的な方法はどれか?PCA(主成分分析)の目的として最も適切なものはどれか?k-meansクラスタリングを実行したとき、初期クラスタ中心をランダムに選び直して再度実行すると、全く異なるクラスタ結果…階層的クラスタリング(凝集型)を用いて大規模なテキストドキュメント群をクラスタリングしたところ、途中で計算が極めて遅くな…DBSCAN(密度ベースのクラスタリング)でε(近傍半径)パラメータを0.5から1.5に増加させたとき、一般的にどのよう…複数の異なる教師なし学習アルゴリズム(k-means、DBSCANと階層的クラスタリング)を同じデータセットに適用したと…
IT・クラウド の関連資格
AWS Certified Cloud Practitioner(CLF-C02)
AWSクラウドの入門資格。クラウドの概念・AWSのコアサービス・セキュリティ・料金モデルを問う。
AWS Certified Solutions Architect - Associate(SAA-C03)
AWSでのシステム設計能力を問うアソシエイト資格。高可用性・セキュリティ・コスト最適化の設計が中心。
DP-900:Microsoft Azure Data Fundamentals
Azureのデータサービスの基礎を問うMicrosoft認定資格。リレーショナル/非リレーショナルデータ、分析ワークロード、コアのデータ概念を扱う。