教師なし学習定義
異常検出(Anomaly Detection)における「外れ値(Outlier)」の定義として最も適切なものはどれか?
A.大多数のデータパターンから大きく逸脱し、異なる分布や生成メカニズムを持つ観測値← 正解
✓ 正解です。外れ値は通常のデータパターンから統計的に大きく乖離し、異なるメカニズムで生成されたと考えられる異常な観測値です。
B.データセット内で最も高い値と最も低い値の差を示す統計量
✗ これはデータの範囲(レンジ)の説明であり、外れ値の定義ではありません。
C.機械学習モデルが正しく予測できなかったサンプルのこと
✗ モデルの予測誤りと外れ値は異なる概念です。予測誤りはモデルの性能に関し、外れ値はデータ自体の性質です。
D.クラスタリング結果において、最も近いクラスタまでの距離が平均値を超えるデータポイント
✗ クラスタ内でのポイントの位置とは無関係に、全体的なデータ分布から見て異常な値が外れ値です。
この問題のポイント
外れ値は通常のデータパターンから統計的に大きく乖離し、異なるメカニズムで生成されたと考えられる異常な観測値です。
「教師なし学習」の他の問題
k-meansクラスタリングで「最適なクラスタ数K」を決める一般的な方法はどれか?PCA(主成分分析)の目的として最も適切なものはどれか?k-meansクラスタリングを実行したとき、初期クラスタ中心をランダムに選び直して再度実行すると、全く異なるクラスタ結果…階層的クラスタリング(凝集型)を用いて大規模なテキストドキュメント群をクラスタリングしたところ、途中で計算が極めて遅くな…DBSCAN(密度ベースのクラスタリング)でε(近傍半径)パラメータを0.5から1.5に増加させたとき、一般的にどのよう…複数の異なる教師なし学習アルゴリズム(k-means、DBSCANと階層的クラスタリング)を同じデータセットに適用したと…
IT・クラウド の関連資格
AWS Certified Cloud Practitioner(CLF-C02)
AWSクラウドの入門資格。クラウドの概念・AWSのコアサービス・セキュリティ・料金モデルを問う。
AWS Certified Solutions Architect - Associate(SAA-C03)
AWSでのシステム設計能力を問うアソシエイト資格。高可用性・セキュリティ・コスト最適化の設計が中心。
DP-900:Microsoft Azure Data Fundamentals
Azureのデータサービスの基礎を問うMicrosoft認定資格。リレーショナル/非リレーショナルデータ、分析ワークロード、コアのデータ概念を扱う。