Azure MLプラットフォーム応用

Azure MLで自動機械学習(AutoML)を実行する際に、トレーニングデータの約35%に欠損値が含まれている場合、AutoMLの処理フローと最終的なモデル性能にはどのような影響が生じるか?

A.AutoMLは欠損値を自動検出し、行全体を削除するため、データセットサイズが65%に縮小される
✗ AutoMLは単純な行削除ではなく、欠損値補完戦略を複数試行する。また、行削除のみでは情報損失が大きすぎる。
B.AutoMLは複数の欠損値補完戦略を試行し、各戦略でのモデル性能を比較してより良い方法を採用する← 正解
✓ 正解です。Azure ML AutoMLは前処理パイプラインの一部として、平均値補完、中央値補完、KNN補完など複数戦略を検証し、最適な方法を採用する。
C.欠損値があると自動的に前処理がスキップされ、欠損値はそのまま学習に使用される
✗ AutoMLは前処理を実施し、欠損値を無視して学習することはない。自動前処理は必ず行われる。
D.AutoMLは欠損値を許容しないため、事前に外部ツールで全て処理することが必須
✗ AutoMLは欠損値を許容し、自動前処理で対応する機能を持つ。事前処理が必須ではない(ただし手動最適化は可能)。

この問題のポイント

Azure ML AutoMLは前処理パイプラインの一部として、平均値補完、中央値補完、KNN補完など複数戦略を検証し、最適な方法を採用する。

AI-900:Microsoft Azure AI Fundamentals の問題一覧