教師なし学習誤り発見
クラスタリング性能の評価指標に関する以下の記述のうち、誤っているものはどれか。
A.シルエット係数は−1から1の範囲の値を取り、1に近いほどクラスタリング結果が良好である。
✓ この記述は正しい。シルエット係数は−1〜1で、1が最良、−1が最悪を示す指標である。
B.デービス・ボルディン指数は、クラスタ内の密度が高く、クラスタ間の距離が近いほど値が小さくなる。← 正解
✓ 正解です。デービス・ボルディン指数は、クラスタ内密度が高く、クラスタ間距離が遠いほど値が小さくなる(記述は逆)。
C.エルボー法は、クラスタ数を増やしていったときに、クラスタ内平方和の減少率が鈍化する点を最適クラスタ数とする手法である。
✓ この記述は正しい。エルボー法はクラスタ内平方和のグラフから、減少率の変曲点を探す手法である。
D.カリンスキー・ハラバス指数は、クラスタ間の距離が大きく、クラスタ内の密度が高いほど値が大きくなる。
✓ この記述は正しい。カリンスキー・ハラバス指数はクラスタ分離度を測り、高い値ほど良好である。
この問題のポイント
デービス・ボルディン指数は、クラスタ内密度が高く、クラスタ間距離が遠いほど値が小さくなる(記述は逆)。
「教師なし学習」の他の問題
k-meansクラスタリングで「最適なクラスタ数K」を決める一般的な方法はどれか?PCA(主成分分析)の目的として最も適切なものはどれか?k-meansクラスタリングを実行したとき、初期クラスタ中心をランダムに選び直して再度実行すると、全く異なるクラスタ結果…階層的クラスタリング(凝集型)を用いて大規模なテキストドキュメント群をクラスタリングしたところ、途中で計算が極めて遅くな…DBSCAN(密度ベースのクラスタリング)でε(近傍半径)パラメータを0.5から1.5に増加させたとき、一般的にどのよう…複数の異なる教師なし学習アルゴリズム(k-means、DBSCANと階層的クラスタリング)を同じデータセットに適用したと…
IT・クラウド の関連資格
AWS Certified Cloud Practitioner(CLF-C02)
AWSクラウドの入門資格。クラウドの概念・AWSのコアサービス・セキュリティ・料金モデルを問う。
AWS Certified Solutions Architect - Associate(SAA-C03)
AWSでのシステム設計能力を問うアソシエイト資格。高可用性・セキュリティ・コスト最適化の設計が中心。
DP-900:Microsoft Azure Data Fundamentals
Azureのデータサービスの基礎を問うMicrosoft認定資格。リレーショナル/非リレーショナルデータ、分析ワークロード、コアのデータ概念を扱う。