Azure MLプラットフォーム応用

Azure Machine Learning上で大規模なハイパーパラメータチューニングを実行する際に、並列処理を有効にするために必要な計算リソースが不足した場合、スケールアウトはできるが処理時間が大幅に増加する状況が発生しました。この場合、Azure ML上での最適な対処方法はどれか?

A.実験の対象パラメータ数を削減し、学習用データセットも同時に縮小する
✗ パラメータとデータを同時に削減すると、モデルの最適化幅が狭くなり、より良いモデル発見の機会を失う可能性が高い。
B.分散トレーニング用のコンピュート クラスターに自動スケーリング機能を有効化し、ノード数の上限を増やす← 正解
✓ 正解です。Azure MLの自動スケーリング機能を活用し、ノード数を動的に増加させることで、並列処理能力を拡張し、処理時間を最適化できる。
C.単一の高性能GPU搭載マシンに変更し、バッチサイズを最大化する
✗ 単一マシンでは並列性が失われ、スケールアウトの利点が得られない。また、バッチサイズ拡大はメモリ逼迫を招く。
D.ハイパーパラメータチューニング自体を中止し、デフォルト値での学習に切り替える
✗ チューニング自体を放棄するのは問題解決ではなく、モデル性能の最適化機会を失う選択である。

この問題のポイント

Azure MLの自動スケーリング機能を活用し、ノード数を動的に増加させることで、並列処理能力を拡張し、処理時間を最適化できる。

AI-900:Microsoft Azure AI Fundamentals の問題一覧