データの基礎定義問題

データパイプラインで「オンプレミスのSQL Serverから1時間ごとに更新されたレコードのみを抽出してAzureに転送する」仕組みを何というか?

A.フルロード(Full Load)
✗ フルロードはテーブル全体を毎回転送する方式。「更新されたレコードのみ」という差分転送ではない。
B.CDC(Change Data Capture)← 正解
✓ 正解。CDC(Change Data Capture)はデータベースのトランザクションログを監視して変更されたレコードのみを検出・転送する技術。フルロードより効率的で、Azure Data FactoryのCDCコネクタでも利用可能。
C.ETLバッチ(全件差し替え)
✗ ETLバッチ全件差し替えはフルロードと同義。差分抽出ではない。
D.ストリーミングIngestion
✗ ストリーミングIngestionはイベント発生時に即時転送する方式。「1時間ごと」というスケジュールはバッチ処理であり別の概念。

DP-900:Microsoft Azure Data Fundamentals の問題一覧