Azure MLOps応用

本番環境のAzure MLモデルに対して段階的なデプロイ戦略(カナリアデプロイ)を実行する際、新しいバージョンのモデルを最初に10%のトラフィックで公開したが、新バージョンの推論精度が旧バージョンより10%低いことが検出された。この時点での最適な対応は?

A.新バージョンを即座に削除し、旧バージョンへすべてのトラフィックを戻す。問題の原因はデプロイ後の調査で明確にする
✗ 削除は過剰な対応で、後に原因調査が困難になります。カナリアデプロイの利点は「被害を限定しながら検証できること」であり、すぐ削除では学習機会を失います。
B.トラフィック比率を10%で維持し、新バージョンの追加データで自動的に改善されるのを待つ
✗ 精度低下は本番環境では許容できない問題です。自動改善の保証もなく、ユーザー体験を著しく損なわせ続けることになります。
C.新バージョンへのトラフィックを段階的に増やし続け、ユーザーに新モデルに適応させる
✗ 精度が10%低いモデルを段階的に普及させれば、より多くのユーザーに悪影響が及びます。カナリアデプロイの目的に反しています。
D.トラフィックを旧バージョンに戻しながら、新バージョンの訓練データ品質や前処理を検証して根本原因を特定する← 正解
✓ 正解です。まずトラフィックを戻して被害を最小化し、同時に新バージョンの訓練データやパイプラインの問題を調査して改善。MLOpsの重要な手順です。

この問題のポイント

まずトラフィックを戻して被害を最小化し、同時に新バージョンの訓練データやパイプラインの問題を調査して改善。MLOpsの重要な手順です。

AI-900:Microsoft Azure AI Fundamentals の問題一覧