Azureデータ分析応用
ある製造企業がAzure Synapse Analytics Serverless SQL Poolを使用して、Azure Data Lake Storage (ADLS) Gen2に保存されたParquet形式データ(月300GB増加)をクエリしていました。SQL検索性能が低下したため、コンピュートを「Serverless」から「Dedicated SQL Pool (DW500)」に変更しました。この変更後、予想外の現象が発生する可能性が最も高いのはどれか?
A.Dedicated SQL Poolは保有リソースが固定されるため、月300GBの増加に伴って自動スケーリングが発生し、課金が毎月増加する
✗ Dedicated SQL Poolは「固定リソース」を持ちますが、データサイズ増加による自動スケーリングはありません。手動スケーリングのみです。
B.Serverless SQLでは使用量ベース課金(TBスキャン単位)であったが、Dedicated SQL PoolはDWU/時間単位の固定課金となり、実際の使用量にかかわらず月額費用が大幅に増加する可能性がある← 正解
✓ 正解です。Serverlessはスキャン量ベース課金で、使用しなければ課金されません。一方、Dedicatedは時間ベース課金のため、使用量が少なくても月額費用が発生し、コスト効率が低下する可能性があります。
C.Dedicated SQL Poolへの移行により、ADLSのParquetデータを自動的にSQLテーブルに変換するため、ストレージコストが半減される
✗ 変更後もデータはADLSに残ったままで、自動変換は発生しません。ストレージコストは変わりません。
D.Dedicated SQL PoolはServerless SQLより高速ですが、300GB増のデータをプール内に物理的に保有する必要があるため、スケールアップが強制される
✗ Dedicated SQL Poolはデータを物理的に保有する必要がなく、ADLSのデータをクエリできます。DWUスケールアップの強制もありません。
この問題のポイント
Serverlessはスキャン量ベース課金で、使用しなければ課金されません。一方、Dedicatedは時間ベース課金のため、使用量が少なくても月額費用が発生し、コスト効率が低下する可能性があります。
「Azureデータ分析」の他の問題
あるデータアナリストチームがADLS Gen2上のParquet形式ログデータ(総容量10TB)に対して月20回程度のア…あるグローバル製造企業がデータ分析環境を構築します。「PythonとScalaでETLとMLモデルを開発するデータエンジ…ある金融企業が「オンプレミスOracleからの日次スナップショット抽出」→「日次集計・通貨換算・NULLクレンジング変換…ある物流会社が配送トラック1,000台のGPSデータをリアルタイムで処理し、「配送遅延を発生から30秒以内に検知してアラ…ある小売企業のCFOがAzure SQL Databaseの売上データを使ったダッシュボードを要求しています。「常に最新…Power BIのImportモードとDirectQueryモードを比較したとき、「大規模データセット(1億行)に対して…
IT・クラウド の関連資格
AWS Certified Cloud Practitioner(CLF-C02)
AWSクラウドの入門資格。クラウドの概念・AWSのコアサービス・セキュリティ・料金モデルを問う。
AWS Certified Solutions Architect - Associate(SAA-C03)
AWSでのシステム設計能力を問うアソシエイト資格。高可用性・セキュリティ・コスト最適化の設計が中心。
AZ-900:Microsoft Azure Fundamentals
クラウドとAzureの基礎を問うMicrosoft認定資格。クラウドの概念、Azureの主要サービス、セキュリティ・コンプライアンス・料金を扱う。