Azure MLで複数のマネージドオンラインエンドポイント間でトラフィック分割（トラフィッ… | AI-900：Microsoft Azure AI Fundamentals

Azure MLOps応用

Azure MLで複数のマネージドオンラインエンドポイント間でトラフィック分割（トラフィックルール）を実施している最中に、一方のモデルが予期せず高レイテンシーを示し始めた場合、どのような対応が可能か？

A.トラフィック分割の比率をリアルタイムで調整し、問題のあるエンドポイントへの流量を減らしながら、並行して根本原因を調査する← 正解

✓ 正解です。Azure MLのトラフィック分割機能により、デプロイを削除せずに比率を動的に変更できます。本番への影響を最小化しつつ問題解決ができます。

B.高レイテンシーのエンドポイントを即座に削除し、他のエンドポイントにすべてのトラフィックを振る

✗ エンドポイント削除は取り返しのつかない対応です。再デプロイに時間がかかり、その間ユーザーに影響があります。まずは流量制御で対応すべきです。

C.Application Insightsでメトリクスを確認して、ログにはパターンを記録するが、トラフィックは変更しない

✗ 監視のみで対応がないと、ユーザーは継続して遅い応答を受け、体験品質が低下します。トラフィック調整による保護が必要です。

D.障害エンドポイントを自動的に検出してフェイルオーバーするため、複数の同一モデルコピーをデプロイしておく必要がある

✗ Azure MLのエンドポイントは既に高可用性を備えており、同一モデルの複数コピーは通常不要です。トラフィック分割と自動スケーリングで対応できます。

この問題のポイント

Azure MLのトラフィック分割機能により、デプロイを削除せずに比率を動的に変更できます。本番への影響を最小化しつつ問題解決ができます。

「Azure MLOps」の他の問題

AWS Certified Cloud Practitioner（CLF-C02）

AWSクラウドの入門資格。クラウドの概念・AWSのコアサービス・セキュリティ・料金モデルを問う。

AWS Certified Solutions Architect - Associate（SAA-C03）

AWSでのシステム設計能力を問うアソシエイト資格。高可用性・セキュリティ・コスト最適化の設計が中心。

DP-900：Microsoft Azure Data Fundamentals

Azureのデータサービスの基礎を問うMicrosoft認定資格。リレーショナル/非リレーショナルデータ、分析ワークロード、コアのデータ概念を扱う。