Azureプラットフォーム応用

Azure Cognitiveサービスの利用中に「Rate Limit Exceeded」エラーが頻繁に発生する場合、スケーリング戦略として最も効果的なアプローチはどれか?

A.現在の価格レベルを即座にS1からS2に上げ、スループットを2倍にする
✗ 価格レベルの急上昇はコスト増加につながり、実装側の最適化なしに効果は限定的である。
B.複数のリソースインスタンスを異なるリージョンに作成し、ロードバランサーで負荷分散する
✗ 複数リージョン展開は可能だが、ロードバランサーの設定に複雑性が増し、初期段階では過剰な対策である。
C.リクエストのバッチ処理化と再試行ロジックの実装、必要に応じてリソースをスケールする← 正解
✓ 正解です。バッチ処理化と再試行ロジックでリクエスト効率を改善し、その後に必要に応じてスケーリングすることが最適です。
D.APIのタイムアウト設定を延長し、クライアント側の待機時間を増やす
✗ タイムアウト延長は根本的な解決にはならず、さらに不安定な動作を招く可能性がある。

この問題のポイント

バッチ処理化と再試行ロジックでリクエスト効率を改善し、その後に必要に応じてスケーリングすることが最適です。

AI-900:Microsoft Azure AI Fundamentals の問題一覧