教師なし学習誤り発見
異常検知とアウトライア検出に関する記述で、誤っているものはどれか。
A.アイソレーション フォレスト(Isolation Forest)は、正常なデータはより深い木構造で分離されやすく、異常値はより浅い位置で分離される原理を利用する。
✓ この記述は正しい。アイソレーション フォレストは異常値が少ないため早期に分離される原理を利用している。
B.ローカル外れ値係数(Local Outlier Factor, LOF)は、グローバルな密度だけを考慮し、各サンプルの局所的な密度を無視する。← 正解
✓ 正解です。LOFは局所的な密度を考慮し、周辺サンプルとの相対的な密度比較によって異常を検出する。記述は逆である。
C.統計的手法では、正規分布を仮定し、平均から3標準偏差以上離れた値を異常と判定することが多い。
✓ この記述は正しい。3σ(3標準偏差)ルールは統計的異常検知の代表的な手法である。
D.One-class SVMは、正常データのみで学習して超平面を決定し、その外側のデータを異常と判定する教師なし手法である。
✓ この記述は正しい。One-class SVMは正常データの分布を学習し、それから外れるデータを異常と判定する。
この問題のポイント
LOFは局所的な密度を考慮し、周辺サンプルとの相対的な密度比較によって異常を検出する。記述は逆である。
「教師なし学習」の他の問題
k-meansクラスタリングで「最適なクラスタ数K」を決める一般的な方法はどれか?PCA(主成分分析)の目的として最も適切なものはどれか?k-meansクラスタリングを実行したとき、初期クラスタ中心をランダムに選び直して再度実行すると、全く異なるクラスタ結果…階層的クラスタリング(凝集型)を用いて大規模なテキストドキュメント群をクラスタリングしたところ、途中で計算が極めて遅くな…DBSCAN(密度ベースのクラスタリング)でε(近傍半径)パラメータを0.5から1.5に増加させたとき、一般的にどのよう…複数の異なる教師なし学習アルゴリズム(k-means、DBSCANと階層的クラスタリング)を同じデータセットに適用したと…
IT・クラウド の関連資格
AWS Certified Cloud Practitioner(CLF-C02)
AWSクラウドの入門資格。クラウドの概念・AWSのコアサービス・セキュリティ・料金モデルを問う。
AWS Certified Solutions Architect - Associate(SAA-C03)
AWSでのシステム設計能力を問うアソシエイト資格。高可用性・セキュリティ・コスト最適化の設計が中心。
DP-900:Microsoft Azure Data Fundamentals
Azureのデータサービスの基礎を問うMicrosoft認定資格。リレーショナル/非リレーショナルデータ、分析ワークロード、コアのデータ概念を扱う。