Azure Machine Learning上で大規模なハイパーパラメータチューニングを実… | AI-900：Microsoft Azure AI Fundamentals

Azure MLプラットフォーム応用

Azure Machine Learning上で大規模なハイパーパラメータチューニングを実行する際に、並列処理を有効にするために必要な計算リソースが不足した場合、スケールアウトはできるが処理時間が大幅に増加する状況が発生しました。この場合、Azure ML上での最適な対処方法はどれか？

A.実験の対象パラメータ数を削減し、学習用データセットも同時に縮小する

✗ パラメータとデータを同時に削減すると、モデルの最適化幅が狭くなり、より良いモデル発見の機会を失う可能性が高い。

B.分散トレーニング用のコンピュートクラスターに自動スケーリング機能を有効化し、ノード数の上限を増やす← 正解

✓ 正解です。Azure MLの自動スケーリング機能を活用し、ノード数を動的に増加させることで、並列処理能力を拡張し、処理時間を最適化できる。

C.単一の高性能GPU搭載マシンに変更し、バッチサイズを最大化する

✗ 単一マシンでは並列性が失われ、スケールアウトの利点が得られない。また、バッチサイズ拡大はメモリ逼迫を招く。

D.ハイパーパラメータチューニング自体を中止し、デフォルト値での学習に切り替える

✗ チューニング自体を放棄するのは問題解決ではなく、モデル性能の最適化機会を失う選択である。

この問題のポイント

Azure MLの自動スケーリング機能を活用し、ノード数を動的に増加させることで、並列処理能力を拡張し、処理時間を最適化できる。

「Azure MLプラットフォーム」の他の問題

AWS Certified Cloud Practitioner（CLF-C02）

AWSクラウドの入門資格。クラウドの概念・AWSのコアサービス・セキュリティ・料金モデルを問う。

AWS Certified Solutions Architect - Associate（SAA-C03）

AWSでのシステム設計能力を問うアソシエイト資格。高可用性・セキュリティ・コスト最適化の設計が中心。

DP-900：Microsoft Azure Data Fundamentals

Azureのデータサービスの基礎を問うMicrosoft認定資格。リレーショナル/非リレーショナルデータ、分析ワークロード、コアのデータ概念を扱う。