Azure MLプラットフォーム応用

Azure MLで構築した機械学習モデルをAzure Kubernetes Service (AKS) に本番環境としてデプロイしたが、リアルタイム予測リクエストの応答時間が予期せず3秒を超えるようになった場合、考えられる原因と対処方法の組み合わせとして最適なものはどれか?

A.モデルのサイズが大きすぎるため、別の軽量モデルに置き換えるしかない
✗ モデル置き換えは最後の手段。まず前処理やリソース最適化を診断するべき。軽量化前に性能ボトルネックを特定することが重要。
B.推論パイプラインの前処理ステップが非効率である可能性が高く、バッチ処理の導入やCPU最適化で改善できる可能性がある← 正解
✓ 正解です。前処理の最適化、キャッシング、CPUリソース増加、バッチ処理導入など、推論パイプライン全体の改善で応答時間を削減できる。
C.AKSクラスターのネットワーク帯域幅不足が主原因であり、データセンター移行が必須
✗ ネットワーク帯域幅が主要因と限定すると、実際の問題(前処理やメモリ不足など)の診断を見落とす。データセンター移行は過度な対応。
D.応答時間の遅延は避けられないため、非同期バッチ処理への変更が唯一の解決策
✗ リアルタイム予測が要件であれば非同期化は不適切。同期最適化で改善する方が優先される。

この問題のポイント

前処理の最適化、キャッシング、CPUリソース増加、バッチ処理導入など、推論パイプライン全体の改善で応答時間を削減できる。

AI-900:Microsoft Azure AI Fundamentals の問題一覧