機械学習の評価誤り発見

機械学習の評価メトリクスと実装上の考慮事項に関する以下の記述で、誤っているものはどれか?

A.多クラス分類問題では、マクロ平均(Macro Average)により全クラスを平等に扱い、ミクロ平均(Micro Average)により全体的な性能を評価することができる。
✓ この記述は正しい。マクロ平均とミクロ平均は異なる視点から多クラス問題を評価する方法である。
B.AUC-ROCスコアが0.8の場合、モデルはランダム分類器(AUC=0.5)より確実に優れており、0.9以上が優秀な性能の目安とされる。← 正解
✓ 正解です。この記述が誤りで、正しくは「AUC=0.8はランダム分類器より高いが、『確実に優れている』とは言い切れない」である。AUC値の評価はドメインや用途によって異なり、一般的には0.7以上で良好、0.9以上で優秀とされるが、絶対的な基準はなく、またAUC=0.8が実用上必ずしも十分とは限らない。
C.ロジスティック回帰モデルにおいて、予測値が0.5以上なら陽性、0.5未満なら陰性と分類する場合、この0.5を「閾値」と呼ぶ。
✓ この記述は正しい。閾値の設定はモデルの予測値の解釈において重要である。
D.適合率と再現率の関係は相互に排他的で、一方を高めると必ずもう一方が低下する傾向がある。
✓ この記述は正しい。適合率と再現率はトレードオフの関係にあり、一般的に一方を高めると他方が低下する傾向がある。

この問題のポイント

この記述が誤りで、正しくは「AUC=0.8はランダム分類器より高いが、『確実に優れている』とは言い切れない」である。AUC値の評価はドメインや用途によって異なり、一般的には0.7以上で良好、0.9以上で優秀とされるが、絶対的な基準はなく、またAUC=0.8が実用上必ずしも十分とは限らない。

AI-900:Microsoft Azure AI Fundamentals の問題一覧