教師なし学習比較

密度ベースのクラスタリング(DBSCANなど)と分割型クラスタリング(k-meansなど)の主な違いは何か?

A.DBSCANは任意形状のクラスタを検出でき、ノイズ点を識別できるが、k-meansは球状クラスタしか検出できない← 正解
✓ 正解です。DBSCANは密度に基づいて任意形状のクラスタを検出でき、密度が低い点をノイズとして扱います。k-meansは球状クラスタを仮定します。
B.k-meansはDBSCANより計算量が少なく、小規模データセット向きである
✗ 計算量の大小関係は逆です。DBSCANはO(n log n)~O(n²)で、k-meansはO(nk)です。
C.DBSCANは事前にクラスタ数を指定する必要があるが、k-meansは指定不要である
✗ 逆です。DBSCANはε(半径)とminPts(最小点数)を指定し、k-meansがK値を指定します。
D.k-meansは外れ値に対してロバストであるが、DBSCANは外れ値に敏感である
✗ 誤りです。DBSCANはノイズ点を明示的に識別できるため、外れ値に対してロバストです。

この問題のポイント

DBSCANは密度に基づいて任意形状のクラスタを検出でき、密度が低い点をノイズとして扱います。k-meansは球状クラスタを仮定します。

AI-900:Microsoft Azure AI Fundamentals の問題一覧