機械学習の評価定義
機械学習モデルの評価における「再現率(Recall)」の定義として最も適切なものはどれか?
A.正と予測したもののうち、実際に正であった割合
✗ この定義は「適合率(Precision)」です。モデルの予測精度を測ります。
B.実際に正であるもののうち、正と予測できた割合← 正解
✓ 正解です。再現率は、実際の正例をどれだけ見落とさずに検出できるかを測る指標で、TP/(TP+FN)で計算されます。
C.モデルが予測した全体のうち、正確だった割合
✗ この定義は「精度(Accuracy)」です。全体的な予測正確性を測ります。
D.負と予測したもののうち、実際に負であった割合
✗ この定義は「特異度(Specificity)」です。負例の検出能力を測ります。
この問題のポイント
再現率は、実際の正例をどれだけ見落とさずに検出できるかを測る指標で、TP/(TP+FN)で計算されます。
「機械学習の評価」の他の問題
スパムフィルターで「正常メールを誤ってスパムと判定する(誤検知)」を極力防ぎたい場合に最優先すべき指標はどれか?AUC-ROCスコアが0.5のモデルはどのような状態を示すか?回帰モデルの評価指標として「予測値と実際値の差の二乗の平均の平方根」を計算するものはどれか?不均衡データ(陽性99%・陰性1%)において「精度(Accuracy)だけが高い(99%)」モデルの問題点はどれか?分類モデルの評価において、適合率(Precision)と再現率(Recall)の違いとして最も正確なものはどれか?医療診断モデルで「疾患有りと予測したが実際は無い(偽陽性)」を減らしたい場合と、「疾患有りを見落とす(偽陰性)」を減らし…
IT・クラウド の関連資格
AWS Certified Cloud Practitioner(CLF-C02)
AWSクラウドの入門資格。クラウドの概念・AWSのコアサービス・セキュリティ・料金モデルを問う。
AWS Certified Solutions Architect - Associate(SAA-C03)
AWSでのシステム設計能力を問うアソシエイト資格。高可用性・セキュリティ・コスト最適化の設計が中心。
DP-900:Microsoft Azure Data Fundamentals
Azureのデータサービスの基礎を問うMicrosoft認定資格。リレーショナル/非リレーショナルデータ、分析ワークロード、コアのデータ概念を扱う。