Azure MLOps応用

Azure MLで複数のマネージドオンラインエンドポイント間でトラフィック分割(トラフィックルール)を実施している最中に、一方のモデルが予期せず高レイテンシーを示し始めた場合、どのような対応が可能か?

A.トラフィック分割の比率をリアルタイムで調整し、問題のあるエンドポイントへの流量を減らしながら、並行して根本原因を調査する← 正解
✓ 正解です。Azure MLのトラフィック分割機能により、デプロイを削除せずに比率を動的に変更できます。本番への影響を最小化しつつ問題解決ができます。
B.高レイテンシーのエンドポイントを即座に削除し、他のエンドポイントにすべてのトラフィックを振る
✗ エンドポイント削除は取り返しのつかない対応です。再デプロイに時間がかかり、その間ユーザーに影響があります。まずは流量制御で対応すべきです。
C.Application Insightsでメトリクスを確認して、ログにはパターンを記録するが、トラフィックは変更しない
✗ 監視のみで対応がないと、ユーザーは継続して遅い応答を受け、体験品質が低下します。トラフィック調整による保護が必要です。
D.障害エンドポイントを自動的に検出してフェイルオーバーするため、複数の同一モデルコピーをデプロイしておく必要がある
✗ Azure MLのエンドポイントは既に高可用性を備えており、同一モデルの複数コピーは通常不要です。トラフィック分割と自動スケーリングで対応できます。

この問題のポイント

Azure MLのトラフィック分割機能により、デプロイを削除せずに比率を動的に変更できます。本番への影響を最小化しつつ問題解決ができます。

AI-900:Microsoft Azure AI Fundamentals の問題一覧