MLの概念定義問題

訓練データセットと検証データセットを分ける主な目的はどれか?

A.訓練を高速化するためにデータを削減する
✗ 分割はデータを削減するためではなく、評価の独立性を確保するために行う。
B.未知のデータへの汎化性能を客観的に評価するため← 正解
✓ 正解。モデルが訓練に使っていないデータで評価することで汎化性能を客観的に測定できる。
C.モデルのパラメータ数を減らすため
✗ パラメータ数はモデルのアーキテクチャで決まり、データ分割とは無関係。
D.データのクラス不均衡を解消するため
✗ クラス不均衡の解消はオーバーサンプリングや重み付けで対処する別の問題。

AI-900:Microsoft Azure AI Fundamentals の問題一覧