AIの基礎誤り発見

機械学習モデルのトレーニング・テストに関する以下の記述のうち、誤っているものはどれか。

A.訓練データ(Training Data)はモデルのパラメータを学習するために使用される。
✓ この記述は正しい。訓練データはモデル学習の基盤である。
B.テストデータ(Test Data)はモデルの性能を検証するために使用され、訓練に使われてはいけない。
✓ この記述は正しい。テストデータの二重使用は一般化性能を過度に評価する危険がある。
C.交差検証(Cross-Validation)は、限られたデータセットを効率的に利用してモデルを評価する手法である。
✓ この記述は正しい。交差検証はデータ利用の効率性と信頼性の両立を実現する。
D.検証データ(Validation Data)は訓練中にモデルを監視する目的で使用されるが、テストデータとして再利用してよい。← 正解
✓ 正解です。この記述が誤りです。検証データとテストデータは異なる役割を持ち、検証データはハイパーパラメータ調整に使用され、テストデータとしては再利用してはいけない(データリーケージ)。

この問題のポイント

この記述が誤りです。検証データとテストデータは異なる役割を持ち、検証データはハイパーパラメータ調整に使用され、テストデータとしては再利用してはいけない(データリーケージ)。

AI-900:Microsoft Azure AI Fundamentals の問題一覧