Azureデータ分析定義問題

ある金融企業が「オンプレミスOracleからの日次スナップショット抽出」→「日次集計・通貨換算・NULLクレンジング変換」→「Azure Synapse Analytics Dedicated SQL Poolへのロード」というパイプラインを構築します。Oracle抽出が成功した場合のみ変換・ロードを実行する依存関係も必要です。パイプラインのオーケストレーションに最適なサービスはどれか?

A.Azure Stream Analytics
✗ Azure Stream AnalyticsはリアルタイムストリーミングSQL処理用。バッチETLのオーケストレーションには使わない。
B.Azure Event Hubs
✗ Event HubsはイベントIngestionサービスであり、パイプラインのオーケストレーション機能を持たない。
C.Azure Data Factory← 正解
✓ 正解。Azure Data FactoryはOracle含む200以上のコネクターを持ち、Self-hosted Integration RuntimeでオンプレミスOracle接続が可能。パイプラインの条件分岐・依存関係(成功時のみ実行)・スケジューリングを管理するETL/ELTオーケストレーションサービス。
D.Azure Databricks(Scheduled Jobs)
✗ Databricksのスケジュールジョブも可能だが、200以上のコネクターや細かいパイプライン依存関係管理ではADFが優位。

DP-900:Microsoft Azure Data Fundamentals の問題一覧