機械学習の評価定義問題
不均衡データ(陽性99%・陰性1%)において「精度(Accuracy)だけが高い(99%)」モデルの問題点はどれか?
A.計算コストが高い
✗ 精度の高さは計算コストとは無関係。
B.常に多数クラスを予測するだけでも99%の精度になり、少数クラスを検出できていない← 正解
✓ 正解。全件を陽性と予測するだけで99%の精度になる。少数クラスの検出にはF1・Recall・AUCを確認すべき。
C.訓練データが多すぎる
✗ データ量は不均衡問題とは別の問題。
D.モデルが複雑すぎる
✗ モデルの複雑さの問題ではなく、評価指標の選択の問題。
「機械学習の評価」の他の問題
IT・クラウド の関連資格
AWS Certified Cloud Practitioner(CLF-C02)
AWSクラウドの入門資格。クラウドの概念・AWSのコアサービス・セキュリティ・料金モデルを問う。
AWS Certified Solutions Architect - Associate(SAA-C03)
AWSでのシステム設計能力を問うアソシエイト資格。高可用性・セキュリティ・コスト最適化の設計が中心。
DP-900:Microsoft Azure Data Fundamentals
Azureのデータサービスの基礎を問うMicrosoft認定資格。リレーショナル/非リレーショナルデータ、分析ワークロード、コアのデータ概念を扱う。