実戦シナリオ定義問題

ある物流会社が全データ分析基盤を刷新します。現状は「250個のオンプレミスSQL ServerDB」から毎週末にデータをAzureに転送しています。「転送をリアルタイムCDCに変更したい」「Azureでデータを処理・変換してレポートを作成したい」「250個のDBを統合して全社KPIを分析したい」という要件があります。最適なアーキテクチャの組み合わせはどれか?

A.SQL Server(CDC) → Azure Event Hubs → Azure Stream Analytics → Azure SQL Database → Power BI
✗ Stream Analyticsはリアルタイムストリーム処理に特化。250個のDBからのCDCデータをOLAPに統合する複雑なETL・変換処理には不向き。Azure SQL DatabaseよりSynapse Analyticsが250個DB統合分析に適切。
B.SQL Server(CDC)→ Azure Data Factory(SHIR)→ Azure Data Lake Storage Gen2 → Azure Synapse Analytics → Power BI Service← 正解
✓ 正解。CDCで変更データを捕捉→ADFのSelf-hosted Integration Runtimeで250個のオンプレミスDBに接続→ADLS Gen2にデータレイク構築→Synapse AnalyticsでMPP分析・全社KPI集計→Power BI Serviceでダッシュボード共有。現代的なデータレイクハウスアーキテクチャ。
C.SQL Server → Azure Queue Storage → Azure Cosmos DB → Power BI Desktop
✗ Queue StorageはCDCデータの高スループット転送には限界がある。Cosmos DBはOLAP分析より個別レコードのルックアップに特化しており250個DB統合の集計分析には不向き。
D.SQL Server → Azure Blob Storage(フラットファイル)→ Azure HDInsight → Azure SQL Database → Power BI
✗ Blob Storageへのフラットファイル転送では真のCDCにならない。HDInsightは管理が複雑で現代的なアーキテクチャでは推奨されにくい。

DP-900:Microsoft Azure Data Fundamentals の問題一覧