機械学習の評価誤り発見
機械学習モデルの性能評価と実装に関する以下の記述で、誤っているものはどれか?
A.訓練損失(Training Loss)がテスト損失(Test Loss)より継続的に低い場合、モデルが過学習している可能性が高い。
✓ この記述は正しい。訓練損失 < テスト損失は過学習の典型的な兆候である。
B.早期停止(Early Stopping)は、検証損失が増加し始めた時点で訓練を中断し、過学習を防ぐ手法である。
✓ この記述は正しい。早期停止は過学習を防ぐ効果的な正則化手法である。
C.混同行列から計算される感度(Sensitivity)と特異度(Specificity)の調和平均がF値である。← 正解
✓ 正解です。この記述が誤りで、F値は「精度(Precision)と再現率(Recall)の調和平均」である。感度と特異度の調和平均ではない。
D.データの分割において、訓練データ、検証データ、テストデータを別々に用意することで、モデル選択とハイパーパラメータ調整が適切に実施される。
✓ この記述は正しい。データの3分割は適切なモデル評価と選択を実現する標準的な実装方法である。
この問題のポイント
この記述が誤りで、F値は「精度(Precision)と再現率(Recall)の調和平均」である。感度と特異度の調和平均ではない。
「機械学習の評価」の他の問題
スパムフィルターで「正常メールを誤ってスパムと判定する(誤検知)」を極力防ぎたい場合に最優先すべき指標はどれか?AUC-ROCスコアが0.5のモデルはどのような状態を示すか?回帰モデルの評価指標として「予測値と実際値の差の二乗の平均の平方根」を計算するものはどれか?不均衡データ(陽性99%・陰性1%)において「精度(Accuracy)だけが高い(99%)」モデルの問題点はどれか?分類モデルの評価において、適合率(Precision)と再現率(Recall)の違いとして最も正確なものはどれか?医療診断モデルで「疾患有りと予測したが実際は無い(偽陽性)」を減らしたい場合と、「疾患有りを見落とす(偽陰性)」を減らし…
IT・クラウド の関連資格
AWS Certified Cloud Practitioner(CLF-C02)
AWSクラウドの入門資格。クラウドの概念・AWSのコアサービス・セキュリティ・料金モデルを問う。
AWS Certified Solutions Architect - Associate(SAA-C03)
AWSでのシステム設計能力を問うアソシエイト資格。高可用性・セキュリティ・コスト最適化の設計が中心。
DP-900:Microsoft Azure Data Fundamentals
Azureのデータサービスの基礎を問うMicrosoft認定資格。リレーショナル/非リレーショナルデータ、分析ワークロード、コアのデータ概念を扱う。