Azure MLのAutoMLで回帰タスクを実行する際、訓練データに外れ値が多く含まれてい… | AI-900：Microsoft Azure AI Fundamentals

難問チャレンジ応用

Azure MLのAutoMLで回帰タスクを実行する際、訓練データに外れ値が多く含まれている場合、モデルのパフォーマンスにはどのような影響が生じ、AutoMLはどのように対処される可能性が高いか？

A.外れ値による誤差が増大し、RMSE値が上昇するため、AutoMLは自動的にロバスト回帰アルゴリズム（例：HuberRegressor）を優先的に試行する← 正解

✓ 正解です。AutoMLは外れ値に強いアルゴリズムの試行を通じて、堅牢なモデル構築を試みます。

B.外れ値は訓練中に無視されるため、モデルのパフォーマンスに影響を与えず、すべてのアルゴリズムが等しく高い精度を達成する

✗ 外れ値は訓練中に無視されません。モデルに悪影響を与えるため、適切なアルゴリズム選択が重要です。

C.外れ値が学習に含まれるため、モデルは外れ値を強く学習し、検証セットでのR²スコアが向上する傾向がある

✗ 外れ値が強く学習されると、汎化性能が低下し、検証セットでのスコアは悪化する傾向があります。

D.AutoMLは外れ値の影響を回避するため、常に訓練データセット全体をフィルタリングしてから学習を開始する

✗ AutoMLは必ずしも訓練データを事前フィルタリングしません。アルゴリズム選択と正則化で対処します。

この問題のポイント

AutoMLは外れ値に強いアルゴリズムの試行を通じて、堅牢なモデル構築を試みます。

「難問チャレンジ」の他の問題

AWS Certified Cloud Practitioner（CLF-C02）

AWSクラウドの入門資格。クラウドの概念・AWSのコアサービス・セキュリティ・料金モデルを問う。

AWS Certified Solutions Architect - Associate（SAA-C03）

AWSでのシステム設計能力を問うアソシエイト資格。高可用性・セキュリティ・コスト最適化の設計が中心。

DP-900：Microsoft Azure Data Fundamentals

Azureのデータサービスの基礎を問うMicrosoft認定資格。リレーショナル/非リレーショナルデータ、分析ワークロード、コアのデータ概念を扱う。