Azureデータ分析応用
ある企業がAzure Synapse Analytics Dedicated SQL Poolで日次ETLパイプラインを実行しています。現在、毎日深夜2時から2時間かけてデータをロードしています。負荷テスト結果から、DW500(500 DWU)では完了に2時間かかりますが、DW1000(1000 DWU)では1時間で完了することが判明しました。ただし、営業時間中(午前9時~午後6時)は毎秒500クエリの分析クエリが実行されます。この状況で、DW500からDW1000にスケールアップした場合、最も可能性が高い影響はどれか?
A.営業時間中の分析クエリ実行時間が短縮され、ユーザーの応答性が向上する
✗ スケールアップによりクエリ応答性が向上する可能性はありますが、ETL時間短縮が主目的であり、設問の文脈では営業時間のクエリ改善は副次的効果です。最も可能性が高い主要な影響とは言えません。
B.ETL実行時間が2時間から1時間に短縮されるが、DWUが倍増するため深夜1時間分の課金コストが増加する← 正解
✓ 正解です。DW1000ではETL実行時間が1時間に短縮されますが、DWUが倍増するため深夜のETL実行中(1時間分)はDW500比で追加コストが発生します。ETL時間短縮が主な効果であり、コスト増加が主な影響となります。
C.営業時間中の分析クエリが実行時間超過エラーで失敗するリスクが増加する
✗ スケールアップはリソース増加なので、クエリ失敗リスクは低下します。逆方向の影響です。
D.日次ETLの完了に必要なコンピュートリソース量が倍増し、課金額が2倍になる
✗ DWUの倍増でETL実行時間が半減するため、コンピュート使用量はDWU×時間の観点では同等になります。「課金額が2倍」は正確ではありません。
この問題のポイント
DW1000ではETL実行時間が1時間に短縮されますが、DWUが倍増するため深夜のETL実行中(1時間分)はDW500比で追加コストが発生します。ETL時間短縮が主な効果であり、コスト増加が主な影響となります。
「Azureデータ分析」の他の問題
あるデータアナリストチームがADLS Gen2上のParquet形式ログデータ(総容量10TB)に対して月20回程度のア…あるグローバル製造企業がデータ分析環境を構築します。「PythonとScalaでETLとMLモデルを開発するデータエンジ…ある金融企業が「オンプレミスOracleからの日次スナップショット抽出」→「日次集計・通貨換算・NULLクレンジング変換…ある物流会社が配送トラック1,000台のGPSデータをリアルタイムで処理し、「配送遅延を発生から30秒以内に検知してアラ…ある小売企業のCFOがAzure SQL Databaseの売上データを使ったダッシュボードを要求しています。「常に最新…Power BIのImportモードとDirectQueryモードを比較したとき、「大規模データセット(1億行)に対して…
IT・クラウド の関連資格
AWS Certified Cloud Practitioner(CLF-C02)
AWSクラウドの入門資格。クラウドの概念・AWSのコアサービス・セキュリティ・料金モデルを問う。
AWS Certified Solutions Architect - Associate(SAA-C03)
AWSでのシステム設計能力を問うアソシエイト資格。高可用性・セキュリティ・コスト最適化の設計が中心。
AZ-900:Microsoft Azure Fundamentals
クラウドとAzureの基礎を問うMicrosoft認定資格。クラウドの概念、Azureの主要サービス、セキュリティ・コンプライアンス・料金を扱う。