AIと機械学習の基礎概念応用問題

k-means クラスタリングにおいて、クラスタ数 k の値を実際のデータの自然なグループ数より大幅に大きく設定した場合、どのような問題が生じるか?

A.アルゴリズムが収束しなくなり、処理が無限ループに陥る
✗ k-meansはkが大きくても収束しますが、意味のないクラスタ分割が生じることが主な問題です。
B.本来まとまっているグループが不必要に分割され、意味のないクラスタが生成される← 正解
✓ 正解です。kが大きすぎると自然なグループが細分化され、過剰分割による意味のないクラスタが生成されます。
C.全てのデータポイントが一つのクラスタにまとめられてしまう
✗ kが大きい場合に全データが一つにまとまることはありません。むしろ逆にkが1の場合にそうなります。
D.各クラスタの重心が同一座標に収束し、クラスタリングが機能しなくなる
✗ kが大きくても各重心は異なる位置に収束します。ただし分割が細かすぎて解釈が困難になります。

AWS Certified AI Practitioner(AIF-C01) の問題一覧