実戦シナリオ定義問題

あるデータエンジニアが「Azure Synapse Analytics Dedicated SQL PoolにオンプレミスのSQL Serverデータをロードしたい」と考えています。「毎日夜間に差分データのみを転送」「転送中の変換(文字コード変換・NULL置換)も実施」「スケジュール管理と依存関係制御が必要」という要件があります。推奨されるアプローチはどれか?

A.bcp(Bulk Copy Program)コマンドをCronで実行してSSMSでデータを確認
✗ bcpコマンドのCron実行はスケジュール管理・依存関係制御・変換機能が限定的で、大規模ETLには推奨されない。運用管理が複雑。
B.Azure Data Factory:SHIR接続→Mapping Data Flowで変換→COPY INTOでDedicated SQL Poolにロード← 正解
✓ 正解。ADFのSelf-hosted IRでオンプレミスSQL Serverに接続→Mapping Data Flowで文字コード変換・NULL置換→COPY INTOでDedicated SQL Poolへの高速ロード。スケジュール(トリガー)と依存関係(アクティビティ間の実行順序)もADFで管理可能。
C.Azure Stream Analyticsで差分データをリアルタイムにDedicated SQL Poolに書き込む
✗ Stream AnalyticsはリアルタイムストリームSQL処理用。夜間の差分バッチ転送・変換・スケジュール管理には設計されていない。
D.SQL Server Agentジョブで直接Dedicated SQL Poolに接続してInsert
✗ SQL Server AgentジョブからAzureのDedicated SQL Poolに直接接続するのはネットワーク設定が複雑で、変換処理のオーケストレーションも困難。

DP-900:Microsoft Azure Data Fundamentals の問題一覧