AIソリューションの実装とユースケース応用問題

Amazon SageMakerでリアルタイム推論エンドポイントを運用中に、突然トラフィックが通常の5倍に急増しました。このとき、エンドポイントの可用性を維持するために最も適切な対応はどれですか?

A.エンドポイントを一度削除して再作成し、より大きなインスタンスタイプに変更する
✗ エンドポイントの再作成はダウンタイムが発生し、急増トラフィックへの即時対応として不適切です。
B.SageMaker Auto Scalingを設定して、トラフィックに応じてインスタンス数を自動的に増減させる← 正解
✓ 正解です。SageMaker Auto Scalingはトラフィック変動に応じてインスタンス数を自動調整し、可用性を維持できます。
C.S3バケットにリクエストをキューイングして、エンドポイントへの負荷を手動で制御する
✗ S3はリクエストキューとして使用する仕組みを持たず、手動制御では急増トラフィックへの対応が遅れます。
D.Amazon CloudFrontを前段に配置してキャッシュによりすべてのリクエストを処理する
✗ CloudFrontはキャッシュに適しますが、動的な推論リクエストはキャッシュできないため根本的な解決になりません。

AWS Certified AI Practitioner(AIF-C01) の問題一覧