訓練データセットと検証データセットを分ける主な目的はどれか？ | AI-900：Microsoft Azure AI Fundamentals

MLの概念定義問題

訓練データセットと検証データセットを分ける主な目的はどれか？

A.訓練を高速化するためにデータを削減する

✗ 分割はデータを削減するためではなく、評価の独立性を確保するために行う。

B.未知のデータへの汎化性能を客観的に評価するため← 正解

✓ 正解。モデルが訓練に使っていないデータで評価することで汎化性能を客観的に測定できる。

C.モデルのパラメータ数を減らすため

✗ パラメータ数はモデルのアーキテクチャで決まり、データ分割とは無関係。

D.データのクラス不均衡を解消するため

✗ クラス不均衡の解消はオーバーサンプリングや重み付けで対処する別の問題。

「MLの概念」の他の問題

AWS Certified Cloud Practitioner（CLF-C02）

AWSクラウドの入門資格。クラウドの概念・AWSのコアサービス・セキュリティ・料金モデルを問う。

AWS Certified Solutions Architect - Associate（SAA-C03）

AWSでのシステム設計能力を問うアソシエイト資格。高可用性・セキュリティ・コスト最適化の設計が中心。

DP-900：Microsoft Azure Data Fundamentals

Azureのデータサービスの基礎を問うMicrosoft認定資格。リレーショナル/非リレーショナルデータ、分析ワークロード、コアのデータ概念を扱う。