難問チャレンジ応用

Azure MLのAutoMLで回帰タスクを実行する際、訓練データに外れ値が多く含まれている場合、モデルのパフォーマンスにはどのような影響が生じ、AutoMLはどのように対処される可能性が高いか?

A.外れ値による誤差が増大し、RMSE値が上昇するため、AutoMLは自動的にロバスト回帰アルゴリズム(例:HuberRegressor)を優先的に試行する← 正解
✓ 正解です。AutoMLは外れ値に強いアルゴリズムの試行を通じて、堅牢なモデル構築を試みます。
B.外れ値は訓練中に無視されるため、モデルのパフォーマンスに影響を与えず、すべてのアルゴリズムが等しく高い精度を達成する
✗ 外れ値は訓練中に無視されません。モデルに悪影響を与えるため、適切なアルゴリズム選択が重要です。
C.外れ値が学習に含まれるため、モデルは外れ値を強く学習し、検証セットでのR²スコアが向上する傾向がある
✗ 外れ値が強く学習されると、汎化性能が低下し、検証セットでのスコアは悪化する傾向があります。
D.AutoMLは外れ値の影響を回避するため、常に訓練データセット全体をフィルタリングしてから学習を開始する
✗ AutoMLは必ずしも訓練データを事前フィルタリングしません。アルゴリズム選択と正則化で対処します。

この問題のポイント

AutoMLは外れ値に強いアルゴリズムの試行を通じて、堅牢なモデル構築を試みます。

AI-900:Microsoft Azure AI Fundamentals の問題一覧