機械学習の評価応用

ローン審査モデルで、陽性(ローン承認)と陰性(ローン拒否)の件数が10:1の不均衡データを使用しています。F1スコアが0.75、精度が0.92の場合、これらの指標からどのような推測が最も合理的ですか?

A.F1スコア0.75は精度0.92より低いため、このモデルは信頼できない
✗ 数値の大小だけでは判断できません。不均衡データでは、F1スコアが精度より低く出ることは正常な現象です。
B.精度92%と高いため、モデルは十分に優良で本番導入に適している
✗ 精度92%でも不均衡データではすべてを陰性と判定するだけで高精度が得られます。不均衡データではF1スコアなど複合指標を優先すべきです。
C.不均衡データでF1スコアが精度より相対的に低いのは正常で、不均衡データの評価ではF1スコアを重視すべき← 正解
✓ 正解です。10:1の不均衡では、精度は陰性側に偏ります。一方F1スコアは適合率と再現率の調和平均であり、少数派(陽性)の検出性能を反映するため、不均衡データ評価ではF1スコアを重視すべきです。
D.陽性と陰性の比率を均衡させることで、精度とF1スコアの差を解消すべき
✗ アプローチとしてはありますが、実際のローン承認比率を人為的に変更することは非現実的で、評価指標の選択で対応すべきです。

この問題のポイント

10:1の不均衡では、精度は陰性側に偏ります。一方F1スコアは適合率と再現率の調和平均であり、少数派(陽性)の検出性能を反映するため、不均衡データ評価ではF1スコアを重視すべきです。

AI-900:Microsoft Azure AI Fundamentals の問題一覧