Azure ML定義問題

不均衡データ(病気あり1%:なし99%)で正解率(Accuracy)だけ使うべきでない理由はどれか?

A.計算コストが非常に高いから
✗ 計算コストの問題ではなく、指標としての信頼性が低いことが理由。
B.すべてを「なし」と予測するだけで99%の正解率になってしまうから← 正解
✓ 正解。多数派を予測し続けるだけで高い数値が出てしまい、少数クラスの検出能力を見誤る。
C.数式が複雑で理解しにくいから
✗ 正解率の数式は「正解数/全件数」と非常にシンプル。複雑さは理由ではない。
D.連続値の予測には使えないから
✗ 正解率は分類指標。不均衡問題での不適切さは連続値の扱いではなくバイアスの問題。

AI-900:Microsoft Azure AI Fundamentals の問題一覧