機械学習の評価誤り発見
機械学習モデルの評価方法と用途に関する以下の記述で、誤っているものはどれか?
A.混同行列(Confusion Matrix)は、TP(真陽性)、TN(真陰性)、FP(偽陽性)、FN(偽陰性)を表示し、分類モデルの詳細な性能を把握するために使用される。
✓ この記述は正しい。混同行列は分類タスクの詳細な性能評価に欠かせないツールである。
B.ROC曲線は閾値を変化させながら、真陽性率と偽陽性率のトレードオフを視覚化する方法であり、AUC値が1に近いほど性能が優れている。
✓ この記述は正しい。ROC曲線はAUCで評価され、1に近いほど優れたモデルを示す。
C.回帰モデルの評価では混同行列を使用することが標準的であり、予測値と実際値のズレを定量化する。← 正解
✓ 正解です。この記述が誤りで、混同行列は分類問題に使用される。回帰モデルはMAE、RMSE、R²などの指標を使うべきである。
D.特異度(Specificity)は実際の陰性のうち、正しく陰性と予測された割合を示す。
✓ この記述は正しい。特異度(Specificity)=TN/(TN+FP)であり、陰性正確度を示す。
この問題のポイント
この記述が誤りで、混同行列は分類問題に使用される。回帰モデルはMAE、RMSE、R²などの指標を使うべきである。
「機械学習の評価」の他の問題
スパムフィルターで「正常メールを誤ってスパムと判定する(誤検知)」を極力防ぎたい場合に最優先すべき指標はどれか?AUC-ROCスコアが0.5のモデルはどのような状態を示すか?回帰モデルの評価指標として「予測値と実際値の差の二乗の平均の平方根」を計算するものはどれか?不均衡データ(陽性99%・陰性1%)において「精度(Accuracy)だけが高い(99%)」モデルの問題点はどれか?分類モデルの評価において、適合率(Precision)と再現率(Recall)の違いとして最も正確なものはどれか?医療診断モデルで「疾患有りと予測したが実際は無い(偽陽性)」を減らしたい場合と、「疾患有りを見落とす(偽陰性)」を減らし…
IT・クラウド の関連資格
AWS Certified Cloud Practitioner(CLF-C02)
AWSクラウドの入門資格。クラウドの概念・AWSのコアサービス・セキュリティ・料金モデルを問う。
AWS Certified Solutions Architect - Associate(SAA-C03)
AWSでのシステム設計能力を問うアソシエイト資格。高可用性・セキュリティ・コスト最適化の設計が中心。
DP-900:Microsoft Azure Data Fundamentals
Azureのデータサービスの基礎を問うMicrosoft認定資格。リレーショナル/非リレーショナルデータ、分析ワークロード、コアのデータ概念を扱う。