ローン審査モデルで、陽性（ローン承認）と陰性（ローン拒否）の件数が10:1の不均衡データを… | AI-900：Microsoft Azure AI Fundamentals

機械学習の評価応用

ローン審査モデルで、陽性（ローン承認）と陰性（ローン拒否）の件数が10:1の不均衡データを使用しています。F1スコアが0.75、精度が0.92の場合、これらの指標からどのような推測が最も合理的ですか？

A.F1スコア0.75は精度0.92より低いため、このモデルは信頼できない

✗ 数値の大小だけでは判断できません。不均衡データでは、F1スコアが精度より低く出ることは正常な現象です。

B.精度92%と高いため、モデルは十分に優良で本番導入に適している

✗ 精度92%でも不均衡データではすべてを陰性と判定するだけで高精度が得られます。不均衡データではF1スコアなど複合指標を優先すべきです。

C.不均衡データでF1スコアが精度より相対的に低いのは正常で、不均衡データの評価ではF1スコアを重視すべき← 正解

✓ 正解です。10:1の不均衡では、精度は陰性側に偏ります。一方F1スコアは適合率と再現率の調和平均であり、少数派（陽性）の検出性能を反映するため、不均衡データ評価ではF1スコアを重視すべきです。

D.陽性と陰性の比率を均衡させることで、精度とF1スコアの差を解消すべき

✗ アプローチとしてはありますが、実際のローン承認比率を人為的に変更することは非現実的で、評価指標の選択で対応すべきです。

この問題のポイント

10:1の不均衡では、精度は陰性側に偏ります。一方F1スコアは適合率と再現率の調和平均であり、少数派（陽性）の検出性能を反映するため、不均衡データ評価ではF1スコアを重視すべきです。

「機械学習の評価」の他の問題

AWS Certified Cloud Practitioner（CLF-C02）

AWSクラウドの入門資格。クラウドの概念・AWSのコアサービス・セキュリティ・料金モデルを問う。

AWS Certified Solutions Architect - Associate（SAA-C03）

AWSでのシステム設計能力を問うアソシエイト資格。高可用性・セキュリティ・コスト最適化の設計が中心。

DP-900：Microsoft Azure Data Fundamentals

Azureのデータサービスの基礎を問うMicrosoft認定資格。リレーショナル/非リレーショナルデータ、分析ワークロード、コアのデータ概念を扱う。