機械学習の基礎定義問題
モデルが訓練データでは高精度だが、初見のデータでは著しく精度が落ちる現象を何というか?
A.アンダーフィッティング
✗ 訓練データでも低精度な状態。今回は訓練データで高精度なので逆の状況。
B.データドリフト
✗ 本番データの分布が時間とともに変化する現象。訓練直後の問題ではない。
C.過学習(オーバーフィッティング)← 正解
✓ 正解。訓練データに過度に適合し、汎化性能が低下した状態。
D.クラス不均衡
✗ 正解クラスのサンプル数に偏りがある問題。精度低下の一因にはなるが直接的な現象の名称ではない。
「機械学習の基礎」の他の問題
混同行列(Confusion Matrix)において「実際は陰性なのに陽性と予測した件数」を何というか?がん検診AIで「見逃し(実際は陽性を陰性と予測)を最小化」したい場合に最優先すべき評価指標はどれか?学習率・木の深さ・エポック数など、訓練前に人が設定するモデルの設定値を何というか?モデルが時間の経過とともに精度低下する原因として「本番データの統計的性質が訓練時から変化した」現象を何というか?複数の決定木をランダムなデータ・特徴量で並列訓練し多数決で予測するアンサンブル学習手法はどれか?モデルの汎化性能をより正確に評価するために、データをK個に分割して交互に検証セットとして使う手法はどれか?
IT・クラウド の関連資格
AWS Certified Cloud Practitioner(CLF-C02)
AWSクラウドの入門資格。クラウドの概念・AWSのコアサービス・セキュリティ・料金モデルを問う。
AWS Certified Solutions Architect - Associate(SAA-C03)
AWSでのシステム設計能力を問うアソシエイト資格。高可用性・セキュリティ・コスト最適化の設計が中心。
DP-900:Microsoft Azure Data Fundamentals
Azureのデータサービスの基礎を問うMicrosoft認定資格。リレーショナル/非リレーショナルデータ、分析ワークロード、コアのデータ概念を扱う。