機械学習の基礎誤り発見
機械学習モデルの学習プロセスに関する以下の記述で、誤っているものはどれか。
A.訓練データセットはモデルのパラメータを調整するために使用され、通常はデータ全体の70~80%が割き当てられる。
✓ この記述は正しい。訓練データは通常全体の70~80%が一般的であり、残りを検証・テストに割き当てる。
B.検証データセット(Validation Set)はハイパーパラメータを調整する際に用いられ、訓練に直接使われない。
✓ この記述は正しい。検証セットでハイパーパラメータを調整し、訓練プロセスには含めない。
C.テストデータセットはモデルの最終的な性能を評価するために使用され、訓練やハイパーパラメータ調整で一度も使用されてはいけない。
✓ この記述は正しい。テストセットは最終評価専用であり、情報漏洩を防ぐため訓練・調整に使ってはいけない。
D.訓練・検証・テストの3つのデータセットを確保できない場合は、訓練と検証のみ分割しても良い。← 正解
✓ 正解です。この記述が誤りで、訓練・検証・テストの3分割が基本原則である。テストセットなしでモデル評価すると過学習の危険性が高まり、真の汎化性能を測定できない。
この問題のポイント
この記述が誤りで、訓練・検証・テストの3分割が基本原則である。テストセットなしでモデル評価すると過学習の危険性が高まり、真の汎化性能を測定できない。
「機械学習の基礎」の他の問題
IT・クラウド の関連資格
AWS Certified Cloud Practitioner(CLF-C02)
AWSクラウドの入門資格。クラウドの概念・AWSのコアサービス・セキュリティ・料金モデルを問う。
AWS Certified Solutions Architect - Associate(SAA-C03)
AWSでのシステム設計能力を問うアソシエイト資格。高可用性・セキュリティ・コスト最適化の設計が中心。
DP-900:Microsoft Azure Data Fundamentals
Azureのデータサービスの基礎を問うMicrosoft認定資格。リレーショナル/非リレーショナルデータ、分析ワークロード、コアのデータ概念を扱う。