教師なし学習応用
DBSCAN(密度ベースのクラスタリング)でε(近傍半径)パラメータを0.5から1.5に増加させたとき、一般的にどのような変化が起こるか?
A.クラスタ数が増加し、より細粒度のクラスタが生成される
✗ εを増加させると、各ポイントの近傍が大きくなり、より多くのポイントが密度結合される傾向があります。そのため、クラスタ数は減少(または変化なし)の方が一般的で、増加ではありません。
B.クラスタ数が減少し、小さなクラスタが合併して大きなクラスタになる可能性が高い← 正解
✓ 正解です。εを増加させると近傍半径が広がり、より遠くのポイントも同一クラスタとして結合されやすくなるため、クラスタ数は減少し、複数の小さなクラスタが1つの大きなクラスタに統合される傾向があります。
C.ノイズポイント(外れ値)の判定が厳しくなり、より多くのポイントがノイズに分類される
✗ εの増加はむしろノイズの判定を緩くします。近傍が広がるため、孤立していたポイントも他のポイントとの距離が近くなる可能性があり、ノイズに分類されるポイントは減少する傾向です。
D.最小ポイント数(MinPts)のデフォルト値が自動的に調整され、結果の再現性が向上する
✗ MinPtsはユーザが事前に指定する独立のパラメータで、εの変更に応じて自動調整されることはありません。各パラメータは明示的に設定する必要があります。
この問題のポイント
εを増加させると近傍半径が広がり、より遠くのポイントも同一クラスタとして結合されやすくなるため、クラスタ数は減少し、複数の小さなクラスタが1つの大きなクラスタに統合される傾向があります。
「教師なし学習」の他の問題
k-meansクラスタリングで「最適なクラスタ数K」を決める一般的な方法はどれか?PCA(主成分分析)の目的として最も適切なものはどれか?k-meansクラスタリングを実行したとき、初期クラスタ中心をランダムに選び直して再度実行すると、全く異なるクラスタ結果…階層的クラスタリング(凝集型)を用いて大規模なテキストドキュメント群をクラスタリングしたところ、途中で計算が極めて遅くな…複数の異なる教師なし学習アルゴリズム(k-means、DBSCANと階層的クラスタリング)を同じデータセットに適用したと…PCAで50個の特徴量を10個の主成分に削減した後、元のデータに対する復元誤差が予想より大きかったとします。この原因とし…
IT・クラウド の関連資格
AWS Certified Cloud Practitioner(CLF-C02)
AWSクラウドの入門資格。クラウドの概念・AWSのコアサービス・セキュリティ・料金モデルを問う。
AWS Certified Solutions Architect - Associate(SAA-C03)
AWSでのシステム設計能力を問うアソシエイト資格。高可用性・セキュリティ・コスト最適化の設計が中心。
DP-900:Microsoft Azure Data Fundamentals
Azureのデータサービスの基礎を問うMicrosoft認定資格。リレーショナル/非リレーショナルデータ、分析ワークロード、コアのデータ概念を扱う。