Azure Machine Learning のリアルタイムエンドポイントに予測リクエスト… | AI-900：Microsoft Azure AI Fundamentals

Azure ML応用

Azure Machine Learning のリアルタイムエンドポイントに予測リクエストが集中し、レスポンスタイムが基準値（500ms）を超える頻度が増えている。性能改善のため、現在の単一ノード構成から複数ノード構成へのスケールアップを検討している。スケール後の効果を正確に判断するために事前に確認すべき最も重要なメトリクスはどれか？

A.スケール前のエンドポイント上でのモデル推論処理そのもの（モデル計算）に要する時間と、ネットワーク往復時間（往復レイテンシ）の割合← 正解

✓ 正解です。モデル計算がボトルネックなら複数ノードスケールが有効、ネットワークレイテンシが主因なら別対策が必要。この割合の分析が改善可能性を判断します。

B.エンドポイントのディスク入出力（I/O）性能とメモリキャッシュヒット率

✗ ディスク I/O はリアルタイムエンドポイントではほぼ関係なく、推論性能改善の観点からは周辺的です。

C.モデルファイルのサイズと、デプロイに要する時間

✗ モデルファイルサイズは初期デプロイに関係しますが、レスポンス時間を大きく左右しません。

D.クライアントから送信されるリクエストの平均ペイロードサイズと圧縮率

✗ ペイロードサイズは若干の影響を与えますが、主要なパフォーマンスボトルネックを特定する上では重要度が低いです。

この問題のポイント

モデル計算がボトルネックなら複数ノードスケールが有効、ネットワークレイテンシが主因なら別対策が必要。この割合の分析が改善可能性を判断します。

⚠ この問題の誤りを報告

← 前の問題練習を始める次の問題 →