Azureデータ分析応用

ある企業がAzure Synapse Analytics Dedicated SQL Poolで日次ETLパイプラインを実行しています。現在、毎日深夜2時から2時間かけてデータをロードしています。負荷テスト結果から、DW500(500 DWU)では完了に2時間かかりますが、DW1000(1000 DWU)では1時間で完了することが判明しました。ただし、営業時間中(午前9時~午後6時)は毎秒500クエリの分析クエリが実行されます。この状況で、DW500からDW1000にスケールアップした場合、最も可能性が高い影響はどれか?

A.営業時間中の分析クエリ実行時間が短縮され、ユーザーの応答性が向上する
✗ スケールアップによりクエリ応答性が向上する可能性はありますが、ETL時間短縮が主目的であり、設問の文脈では営業時間のクエリ改善は副次的効果です。最も可能性が高い主要な影響とは言えません。
B.ETL実行時間が2時間から1時間に短縮されるが、DWUが倍増するため深夜1時間分の課金コストが増加する← 正解
✓ 正解です。DW1000ではETL実行時間が1時間に短縮されますが、DWUが倍増するため深夜のETL実行中(1時間分)はDW500比で追加コストが発生します。ETL時間短縮が主な効果であり、コスト増加が主な影響となります。
C.営業時間中の分析クエリが実行時間超過エラーで失敗するリスクが増加する
✗ スケールアップはリソース増加なので、クエリ失敗リスクは低下します。逆方向の影響です。
D.日次ETLの完了に必要なコンピュートリソース量が倍増し、課金額が2倍になる
✗ DWUの倍増でETL実行時間が半減するため、コンピュート使用量はDWU×時間の観点では同等になります。「課金額が2倍」は正確ではありません。

この問題のポイント

DW1000ではETL実行時間が1時間に短縮されますが、DWUが倍増するため深夜のETL実行中(1時間分)はDW500比で追加コストが発生します。ETL時間短縮が主な効果であり、コスト増加が主な影響となります。

DP-900:Microsoft Azure Data Fundamentals の問題一覧