教師なし学習定義
シルエット係数(Silhouette Coefficient)とは何か?その主な用途は何か?
A.クラスタ内の凝集度とクラスタ間の分離度に基づいて、クラスタリング結果の品質を評価する指標← 正解
✓ 正解です。シルエット係数は-1から1の値を取り、1に近いほどクラスタリングが良好(凝集度が高く分離度も高い)で、0に近いと区分が曖昧であることを示します。
B.複数の特徴量を低次元空間に圧縮して、データの可視化を行うための次元削減手法
✗ これは主成分分析(PCA)など次元削減手法の説明です。シルエット係数とは異なります。
C.クラスタの中心点と周辺データポイント間の平均距離を計算する統計量
✗ この説明はシルエット係数の計算に関わる一部の概念ですが、全体的な定義や用途としては不正確です。
D.異なるクラスタリングアルゴリズム間の処理速度を比較するパフォーマンス指標
✗ シルエット係数はアルゴリズムの速度を比較するものではなく、クラスタリング品質を評価する指標です。
この問題のポイント
シルエット係数は-1から1の値を取り、1に近いほどクラスタリングが良好(凝集度が高く分離度も高い)で、0に近いと区分が曖昧であることを示します。
「教師なし学習」の他の問題
k-meansクラスタリングで「最適なクラスタ数K」を決める一般的な方法はどれか?PCA(主成分分析)の目的として最も適切なものはどれか?k-meansクラスタリングを実行したとき、初期クラスタ中心をランダムに選び直して再度実行すると、全く異なるクラスタ結果…階層的クラスタリング(凝集型)を用いて大規模なテキストドキュメント群をクラスタリングしたところ、途中で計算が極めて遅くな…DBSCAN(密度ベースのクラスタリング)でε(近傍半径)パラメータを0.5から1.5に増加させたとき、一般的にどのよう…複数の異なる教師なし学習アルゴリズム(k-means、DBSCANと階層的クラスタリング)を同じデータセットに適用したと…
IT・クラウド の関連資格
AWS Certified Cloud Practitioner(CLF-C02)
AWSクラウドの入門資格。クラウドの概念・AWSのコアサービス・セキュリティ・料金モデルを問う。
AWS Certified Solutions Architect - Associate(SAA-C03)
AWSでのシステム設計能力を問うアソシエイト資格。高可用性・セキュリティ・コスト最適化の設計が中心。
DP-900:Microsoft Azure Data Fundamentals
Azureのデータサービスの基礎を問うMicrosoft認定資格。リレーショナル/非リレーショナルデータ、分析ワークロード、コアのデータ概念を扱う。