Azureデータ分析応用
ある金融企業がPower BIで1,000万行の顧客トランザクションデータを使用したレポートを作成しています。現在、Importモード(ローカル圧縮キャッシュ)を使用しており、レポートファイルサイズは250MBです。同社が「レポートの応答時間を現在の2秒から0.3秒以下に短縮したい」という要件を提示しました。DirectQueryモードへの切り替えを検討していますが、このシナリオでDirectQueryを採用した場合の最も可能性が高い結果はどれか?
A.DirectQueryはクエリをリアルタイムで実行するため、常に最新データが保証され、応答時間は0.3秒以下に短縮される
✗ DirectQueryがリアルタイムであることは正しいですが、応答時間短縮の保証はありません。バックエンド処理速度に左右されます。
B.DirectQueryはネットワーク遅延とバックエンド処理時間に依存するため、応答時間短縮の保証はなく、むしろ遅くなる可能性がある← 正解
✓ 正解です。DirectQueryはレポート実行時にバックエンドデータベースへ毎回クエリを送信するため、ネットワーク遅延と処理時間が応答性を決定します。高速化の保証はなく、遅くなる可能性もあります。
C.DirectQueryに切り替えると、Power BI Serviceのクエリ最適化エンジンにより自動的に応答時間が75%短縮される
✗ Power BIの「自動最適化」でそのような固定短縮率は保証されません。バックエンド依存です。
D.DirectQueryはバックエンドデータベースのインデックス戦略に完全に依存し、不適切なインデックスがあると応答時間は悪化する
✗ インデックス戦略は確かに影響しますが「完全に依存」と「必ず悪化」は過度です。適切な設計で対応可能です。
この問題のポイント
DirectQueryはレポート実行時にバックエンドデータベースへ毎回クエリを送信するため、ネットワーク遅延と処理時間が応答性を決定します。高速化の保証はなく、遅くなる可能性もあります。
「Azureデータ分析」の他の問題
あるデータアナリストチームがADLS Gen2上のParquet形式ログデータ(総容量10TB)に対して月20回程度のア…あるグローバル製造企業がデータ分析環境を構築します。「PythonとScalaでETLとMLモデルを開発するデータエンジ…ある金融企業が「オンプレミスOracleからの日次スナップショット抽出」→「日次集計・通貨換算・NULLクレンジング変換…ある物流会社が配送トラック1,000台のGPSデータをリアルタイムで処理し、「配送遅延を発生から30秒以内に検知してアラ…ある小売企業のCFOがAzure SQL Databaseの売上データを使ったダッシュボードを要求しています。「常に最新…Power BIのImportモードとDirectQueryモードを比較したとき、「大規模データセット(1億行)に対して…
IT・クラウド の関連資格
AWS Certified Cloud Practitioner(CLF-C02)
AWSクラウドの入門資格。クラウドの概念・AWSのコアサービス・セキュリティ・料金モデルを問う。
AWS Certified Solutions Architect - Associate(SAA-C03)
AWSでのシステム設計能力を問うアソシエイト資格。高可用性・セキュリティ・コスト最適化の設計が中心。
AZ-900:Microsoft Azure Fundamentals
クラウドとAzureの基礎を問うMicrosoft認定資格。クラウドの概念、Azureの主要サービス、セキュリティ・コンプライアンス・料金を扱う。