教師なし学習計算
階層的クラスタリング(ウォード法)で、2つのクラスタAとBのユークリッド距離が3.2、クラスタAのデータポイント数が6個、クラスタBのデータポイント数が4個のとき、マージ後のクラスタ間距離として最も適切な計算方法はどれか?
A.d = 3.2(変わらない)
✗ ウォード法ではクラスタサイズとのサンプルサイズの調和平均を考慮した距離更新が必要で、距離は変わります。
B.d = √((6×4)/(6+4)) × 3.2 ≈ 2.40← 正解
✓ 正解です。ウォード法の距離は d = √((n₁×n₂)/(n₁+n₂)) × d₁₂ = √(24/10) × 3.2 ≈ 2.40 となります。
C.d = (6+4)/2 × 3.2 = 16.0
✗ クラスタのサイズを加算して乗じるのは誤りです。ウォード法の正しい式は調和平均を使用します。
D.d = 3.2/2 = 1.6
✗ 単純に2で割るのは不正確です。ウォード法ではサンプルサイズと距離の関係を考慮する必要があります。
この問題のポイント
ウォード法の距離は d = √((n₁×n₂)/(n₁+n₂)) × d₁₂ = √(24/10) × 3.2 ≈ 2.40 となります。
「教師なし学習」の他の問題
k-meansクラスタリングで「最適なクラスタ数K」を決める一般的な方法はどれか?PCA(主成分分析)の目的として最も適切なものはどれか?k-meansクラスタリングを実行したとき、初期クラスタ中心をランダムに選び直して再度実行すると、全く異なるクラスタ結果…階層的クラスタリング(凝集型)を用いて大規模なテキストドキュメント群をクラスタリングしたところ、途中で計算が極めて遅くな…DBSCAN(密度ベースのクラスタリング)でε(近傍半径)パラメータを0.5から1.5に増加させたとき、一般的にどのよう…複数の異なる教師なし学習アルゴリズム(k-means、DBSCANと階層的クラスタリング)を同じデータセットに適用したと…
IT・クラウド の関連資格
AWS Certified Cloud Practitioner(CLF-C02)
AWSクラウドの入門資格。クラウドの概念・AWSのコアサービス・セキュリティ・料金モデルを問う。
AWS Certified Solutions Architect - Associate(SAA-C03)
AWSでのシステム設計能力を問うアソシエイト資格。高可用性・セキュリティ・コスト最適化の設計が中心。
DP-900:Microsoft Azure Data Fundamentals
Azureのデータサービスの基礎を問うMicrosoft認定資格。リレーショナル/非リレーショナルデータ、分析ワークロード、コアのデータ概念を扱う。