機械学習の評価比較
医療診断モデルで「疾患有りと予測したが実際は無い(偽陽性)」を減らしたい場合と、「疾患有りを見落とす(偽陰性)」を減らしたい場合では、それぞれ優先すべき指標はどれか?
A.どちらの場合も精度(Accuracy)を最大化すべき
✗ 精度は全体の正解率であり、偽陽性と偽陰性のバランスを個別には反映しません。医療診断ではより細粒度の指標が必要です。
B.偽陽性を減らしたい場合は適合率、偽陰性を減らしたい場合は再現率を優先する← 正解
✓ 正解です。適合率は「陽性予測の信頼性」(偽陽性を減らす)、再現率は「実際の陽性の発見率」(偽陰性を減らす)を表します。
C.偽陽性を減らしたい場合は再現率、偽陰性を減らしたい場合は適合率を優先する
✗ これは逆です。適合率が偽陽性を減らし、再現率が偽陰性を減らすことに注意してください。
D.どちらもF1スコアだけを使って判断すべき
✗ F1スコアは適合率と再現率の調和平均であり、両者のバランスを見ます。用途に応じて個別指標を優先することが重要です。
この問題のポイント
適合率は「陽性予測の信頼性」(偽陽性を減らす)、再現率は「実際の陽性の発見率」(偽陰性を減らす)を表します。
「機械学習の評価」の他の問題
スパムフィルターで「正常メールを誤ってスパムと判定する(誤検知)」を極力防ぎたい場合に最優先すべき指標はどれか?AUC-ROCスコアが0.5のモデルはどのような状態を示すか?回帰モデルの評価指標として「予測値と実際値の差の二乗の平均の平方根」を計算するものはどれか?不均衡データ(陽性99%・陰性1%)において「精度(Accuracy)だけが高い(99%)」モデルの問題点はどれか?分類モデルの評価において、適合率(Precision)と再現率(Recall)の違いとして最も正確なものはどれか?混同行列(Confusion Matrix)における「真陽性(TP)」と「真陰性(TN)」の違いは何か?
IT・クラウド の関連資格
AWS Certified Cloud Practitioner(CLF-C02)
AWSクラウドの入門資格。クラウドの概念・AWSのコアサービス・セキュリティ・料金モデルを問う。
AWS Certified Solutions Architect - Associate(SAA-C03)
AWSでのシステム設計能力を問うアソシエイト資格。高可用性・セキュリティ・コスト最適化の設計が中心。
DP-900:Microsoft Azure Data Fundamentals
Azureのデータサービスの基礎を問うMicrosoft認定資格。リレーショナル/非リレーショナルデータ、分析ワークロード、コアのデータ概念を扱う。