機械学習の評価応用

クレジットカード詐欺検出モデルで、精度(Accuracy)は98%でしたが、実際の詐欺事例の85%を検出できていません。この矛盾が起きる理由として最も適切なものはどれですか?

A.訓練データが不足しており、モデルに充分な学習ができていない
✗ 訓練データ不足は通常、精度自体を低下させます。ここでは精度が高いため、問題は別の原因です。
B.詐欺取引が全体の2%程度と少数派であり、精度が高くても詐欺を見落とす可能性があり、再現率(感度)を確認する必要がある← 正解
✓ 正解です。詐欺は全取引の2%など極少数派です。すべてを正常と判定しても98%の精度が得られるため、精度だけでは詐欺検出性能を評価できず、再現率(見落とした詐欺数)を確認する必要があります。
C.モデルの予測閾値が高すぎるため、判定基準を下げるだけで改善する
✗ 閾値調整は再現率と適合率のトレードオフに影響しますが、「精度は高いのに詐欺検出率が低い」という矛盾を説明しません。
D.評価指標として精度を使うことが誤りで、別の指標に変更すべき
✗ 精度自体が悪い指標ではなく、不均衡データにおいて精度だけで判断することが問題です。追加指標で補完する必要があります。

この問題のポイント

詐欺は全取引の2%など極少数派です。すべてを正常と判定しても98%の精度が得られるため、精度だけでは詐欺検出性能を評価できず、再現率(見落とした詐欺数)を確認する必要があります。

AI-900:Microsoft Azure AI Fundamentals の問題一覧