機械学習の評価定義問題

不均衡データ(陽性99%・陰性1%)において「精度(Accuracy)だけが高い(99%)」モデルの問題点はどれか?

A.計算コストが高い
✗ 精度の高さは計算コストとは無関係。
B.常に多数クラスを予測するだけでも99%の精度になり、少数クラスを検出できていない← 正解
✓ 正解。全件を陽性と予測するだけで99%の精度になる。少数クラスの検出にはF1・Recall・AUCを確認すべき。
C.訓練データが多すぎる
✗ データ量は不均衡問題とは別の問題。
D.モデルが複雑すぎる
✗ モデルの複雑さの問題ではなく、評価指標の選択の問題。

AI-900:Microsoft Azure AI Fundamentals の問題一覧