Azure ML発展応用
Azure MLで複数ノードを使用した分散訓練を実施中に、あるワーカーノードが接続を失った場合、チェックポイント機能が有効になっていたときの動作として正しいものはどれか?
A.訓練は即座に失敗し、初めから再開する必要がある
✗ チェックポイント機能により、訓練を初めからやり直す必要はありません。保存済みの状態から効率的に再開できます。
B.最後のチェックポイントから訓練を再開でき、計算時間の無駄を削減できる← 正解
✓ 正解です。チェックポイント機能により、モデルの重み、オプティマイザ状態、訓練ステップなどが定期的に保存されます。ノード障害発生時に最後のチェックポイントから訓練を再開できるため、計算リソースの無駄を大幅に削減できます。
C.他のワーカーノードが自動的に失敗ノードのパラメータを復元する
✗ 他のワーカーノードがパラメータ復元を自動的に行うわけではなく、チェックポイントから明示的に復元する必要があります。
D.チェックポイントは分散訓練では機能しない
✗ チェックポイント機能は分散訓練でこそ重要性が高く、適切に構成すれば機能します。
この問題のポイント
チェックポイント機能により、モデルの重み、オプティマイザ状態、訓練ステップなどが定期的に保存されます。ノード障害発生時に最後のチェックポイントから訓練を再開できるため、計算リソースの無駄を大幅に削減できます。
「Azure ML発展」の他の問題
Azure MLのMLflowの「実験(Experiment)」と「実行(Run)」の関係はどれか?Azure MLパイプラインを使う主な利点として正しくないものはどれか?Azure MLにおける「自動機械学習(AutoML)」と「設計者(Designer)」の違いとして最も適切なものはどれ…Azure MLの「コンピュート・インスタンス」と「コンピュート・クラスタ」の使用目的の違いはどれか?Azure MLの「パイプライン」と「Automated Machine Learning(AutoML)」を比較した場…Azure MLにおける「バッチ推論」と「リアルタイム推論(オンライン推論)」の違いとして最適なものはどれか?
IT・クラウド の関連資格
AWS Certified Cloud Practitioner(CLF-C02)
AWSクラウドの入門資格。クラウドの概念・AWSのコアサービス・セキュリティ・料金モデルを問う。
AWS Certified Solutions Architect - Associate(SAA-C03)
AWSでのシステム設計能力を問うアソシエイト資格。高可用性・セキュリティ・コスト最適化の設計が中心。
DP-900:Microsoft Azure Data Fundamentals
Azureのデータサービスの基礎を問うMicrosoft認定資格。リレーショナル/非リレーショナルデータ、分析ワークロード、コアのデータ概念を扱う。