教師なし学習誤り発見
次元削減とクラスタリングに関する記述で、誤っているものはどれか。
A.t-SNEは非線形な次元削減手法であり、高次元データを2次元や3次元に投影する際に局所的な構造をよく保持する。
✓ この記述は正しい。t-SNEは非線形手法で、局所的な近傍構造を保持することで、クラスタの分離が明確に可視化される。
B.UMAP(Uniform Manifold Approximation and Projection)は、計算速度がt-SNEよりも遅く、大規模データセットには不向きである。← 正解
✓ 正解です。UMAPはt-SNEよりも計算効率が高く、大規模データセットにより適している。記述は逆である。
C.PCAは線形な次元削減手法であり、最大分散を保つような軸を見つけることで次元数を削減する。
✓ この記述は正しい。PCAは最大分散方向の主成分を選択し、それらの線形結合で次元削減を行う。
D.オートエンコーダは、入力層と出力層を同じ次元に設定し、隠れ層で圧縮された表現を学習することで次元削減を実現できる。
✓ この記述は正しい。オートエンコーダは入出力が同じ次元で、隠れ層が入力より小さいボトルネック構造で次元削減を実現する。
この問題のポイント
UMAPはt-SNEよりも計算効率が高く、大規模データセットにより適している。記述は逆である。
「教師なし学習」の他の問題
k-meansクラスタリングで「最適なクラスタ数K」を決める一般的な方法はどれか?PCA(主成分分析)の目的として最も適切なものはどれか?k-meansクラスタリングを実行したとき、初期クラスタ中心をランダムに選び直して再度実行すると、全く異なるクラスタ結果…階層的クラスタリング(凝集型)を用いて大規模なテキストドキュメント群をクラスタリングしたところ、途中で計算が極めて遅くな…DBSCAN(密度ベースのクラスタリング)でε(近傍半径)パラメータを0.5から1.5に増加させたとき、一般的にどのよう…複数の異なる教師なし学習アルゴリズム(k-means、DBSCANと階層的クラスタリング)を同じデータセットに適用したと…
IT・クラウド の関連資格
AWS Certified Cloud Practitioner(CLF-C02)
AWSクラウドの入門資格。クラウドの概念・AWSのコアサービス・セキュリティ・料金モデルを問う。
AWS Certified Solutions Architect - Associate(SAA-C03)
AWSでのシステム設計能力を問うアソシエイト資格。高可用性・セキュリティ・コスト最適化の設計が中心。
DP-900:Microsoft Azure Data Fundamentals
Azureのデータサービスの基礎を問うMicrosoft認定資格。リレーショナル/非リレーショナルデータ、分析ワークロード、コアのデータ概念を扱う。