機械学習の評価比較
分類モデルの評価において、適合率(Precision)と再現率(Recall)の違いとして最も正確なものはどれか?
A.適合率は予測が陽性の中で実際も陽性の割合であり、再現率は実際の陽性の中で正しく予測できた割合である← 正解
✓ 正解です。適合率(TP/(TP+FP))は「陽性と予測した中での正確さ」、再現率(TP/(TP+FN))は「実際の陽性をどれだけ見つけたか」を表します。
B.適合率は全体の正解率を表し、再現率はモデルの偏りを表す指標である
✗ 精度(Accuracy)が全体の正解率を表す指標です。適合率と再現率は異なる観点から予測の品質を測ります。
C.適合率はテストデータでの精度を表し、再現率は訓練データでの精度を表す
✗ 適合率と再現率は両方ともテストデータで計算されます。訓練データと評価データの分割ではありません。
D.適合率と再現率は同じ意味であり、呼び方が異なるだけである
✗ 適合率と再現率は異なる定義の指標です。誤検知と見落とし、どちらを重視するかで使い分けられます。
この問題のポイント
適合率(TP/(TP+FP))は「陽性と予測した中での正確さ」、再現率(TP/(TP+FN))は「実際の陽性をどれだけ見つけたか」を表します。
「機械学習の評価」の他の問題
スパムフィルターで「正常メールを誤ってスパムと判定する(誤検知)」を極力防ぎたい場合に最優先すべき指標はどれか?AUC-ROCスコアが0.5のモデルはどのような状態を示すか?回帰モデルの評価指標として「予測値と実際値の差の二乗の平均の平方根」を計算するものはどれか?不均衡データ(陽性99%・陰性1%)において「精度(Accuracy)だけが高い(99%)」モデルの問題点はどれか?医療診断モデルで「疾患有りと予測したが実際は無い(偽陽性)」を減らしたい場合と、「疾患有りを見落とす(偽陰性)」を減らし…混同行列(Confusion Matrix)における「真陽性(TP)」と「真陰性(TN)」の違いは何か?
IT・クラウド の関連資格
AWS Certified Cloud Practitioner(CLF-C02)
AWSクラウドの入門資格。クラウドの概念・AWSのコアサービス・セキュリティ・料金モデルを問う。
AWS Certified Solutions Architect - Associate(SAA-C03)
AWSでのシステム設計能力を問うアソシエイト資格。高可用性・セキュリティ・コスト最適化の設計が中心。
DP-900:Microsoft Azure Data Fundamentals
Azureのデータサービスの基礎を問うMicrosoft認定資格。リレーショナル/非リレーショナルデータ、分析ワークロード、コアのデータ概念を扱う。