AIソリューションの実装とユースケース比較問題
機械学習における「バッチ推論(Batch Inference)」と「リアルタイム推論(Real-time Inference)」の違いとして最も適切な説明はどれですか?
A.バッチ推論はGPUを使用し、リアルタイム推論はCPUのみ使用するという違いがある
✗ 使用するハードウェア(GPU/CPU)は推論方式の本質的な違いではなく、両方式とも構成次第でいずれも利用可能です。
B.バッチ推論は大量データをまとめて非同期で処理するため低コストになりやすく、リアルタイム推論は即時応答が必要なケースでリクエストごとに予測を返す← 正解
✓ 正解です。バッチ推論はSageMaker Batch Transformなどで大量データを一括処理しエンドポイントを常時稼働させないためコスト効率が高く、リアルタイム推論はエンドポイントを常時稼働させミリ秒単位の応答が必要なアプリケーションに適します。
C.バッチ推論は精度が高く、リアルタイム推論は精度が低いという特性がある
✗ モデルの精度は推論方式(バッチ/リアルタイム)ではなく、モデルのアーキテクチャや学習データの質によって決まります。
D.バッチ推論とリアルタイム推論はSageMakerでは同一の設定で利用でき、課金体系のみ異なる
✗ バッチ推論とリアルタイム推論はSageMakerで異なるサービス(Batch Transform vs Endpoint)を使用し、設定も課金体系も異なります。