機械学習の評価比較

医療診断モデルで「疾患有りと予測したが実際は無い(偽陽性)」を減らしたい場合と、「疾患有りを見落とす(偽陰性)」を減らしたい場合では、それぞれ優先すべき指標はどれか?

A.どちらの場合も精度(Accuracy)を最大化すべき
✗ 精度は全体の正解率であり、偽陽性と偽陰性のバランスを個別には反映しません。医療診断ではより細粒度の指標が必要です。
B.偽陽性を減らしたい場合は適合率、偽陰性を減らしたい場合は再現率を優先する← 正解
✓ 正解です。適合率は「陽性予測の信頼性」(偽陽性を減らす)、再現率は「実際の陽性の発見率」(偽陰性を減らす)を表します。
C.偽陽性を減らしたい場合は再現率、偽陰性を減らしたい場合は適合率を優先する
✗ これは逆です。適合率が偽陽性を減らし、再現率が偽陰性を減らすことに注意してください。
D.どちらもF1スコアだけを使って判断すべき
✗ F1スコアは適合率と再現率の調和平均であり、両者のバランスを見ます。用途に応じて個別指標を優先することが重要です。

この問題のポイント

適合率は「陽性予測の信頼性」(偽陽性を減らす)、再現率は「実際の陽性の発見率」(偽陰性を減らす)を表します。

AI-900:Microsoft Azure AI Fundamentals の問題一覧