データの基礎比較

「バッチ処理」と「ストリーム処理」の最適な用途の違いはどれか?

A.バッチ処理は大量データの定期的な一括処理に適し、ストリーム処理はリアルタイムで逐次到着するデータの即座の分析に適している← 正解
✓ 正解です。バッチは日次・月次集計、ストリームは異常検知・リアルタイム監視など、処理特性と要件で選択します。
B.ストリーム処理は精度が低いため、機械学習モデルには不適切である
✗ ストリーム処理でも高精度分析・機械学習適用は可能です。オンラインラーニングなど専門的な手法があります。
C.バッチ処理のみがクラウドで実行可能で、ストリーム処理はオンプレミス限定である
✗ 両方ともクラウド上で実行可能です。Azure Stream AnalyticsやEvent Hubs等のサービスがあります。
D.両者に優劣はなく、データ形式(構造化/非構造化)によってのみ選択が決まる
✗ データ形式より「リアルタイム性の要否」「レイテンシ許容度」「スケーラビリティ要件」で選択します。

この問題のポイント

バッチは日次・月次集計、ストリームは異常検知・リアルタイム監視など、処理特性と要件で選択します。

DP-900:Microsoft Azure Data Fundamentals の問題一覧