難問・アンチパターン定義問題
Azure Synapse Analytics Dedicated SQL Poolの「HASH分散」テーブルで最もパフォーマンスが向上するシナリオはどれか?
A.数行しかないルックアップテーブル(コード・マスターテーブル)
✗ 数行のルックアップテーブルはREPLICATE分散が適切(全ノードにコピーしてJOINを高速化)。
B.毎日数百万行を追加する大規模なファクトテーブルで、JOINに使う列をHASH分散キーにする← 正解
✓ 正解。HASH分散は指定した列のハッシュ値で行を分散ノードに振り分ける。大規模ファクトテーブルで、JOINに使う列(例:顧客ID)をHASH分散キーにすることで、JOINの際に関連データが同一ノードに配置されデータ移動が最小化されパフォーマンスが最大化される。
C.1回だけデータをロードして削除するステージングテーブル
✗ ステージングテーブルは一時的なのでROUND_ROBINが適切(設定が簡単で均等分散)。
D.データが均等に分散されることが確認されていないが取り敢えず主キーをHASH分散キーにする
✗ HASHが均等に分散しない列(ホットスポットになる列)を選ぶとパフォーマンスが悪化する。スキュー(データ偏り)のない列を選ぶことが重要。
「難問・アンチパターン」の他の問題
Cosmos DBについて「誤っている」記述はどれか?以下のAzureアーキテクチャ設計のうち「最も深刻な問題がある」のはどれか?データエンジニアが「Azure Synapse Analytics Serverless SQL Poolを使えば、毎秒…開発者が「Power BIのImportモードを使えば、Azure SQL Databaseのデータが常にリアルタイムで…あるシステムで「Azure Table StorageのPartitionKeyにデバイスの設置日(2024-01-15…「Azure Data Factoryのコスト最適化のため、すべてのETLパイプラインをAzure IR(Integra…
IT・クラウド の関連資格
AWS Certified Cloud Practitioner(CLF-C02)
AWSクラウドの入門資格。クラウドの概念・AWSのコアサービス・セキュリティ・料金モデルを問う。
AWS Certified Solutions Architect - Associate(SAA-C03)
AWSでのシステム設計能力を問うアソシエイト資格。高可用性・セキュリティ・コスト最適化の設計が中心。
AZ-900:Microsoft Azure Fundamentals
クラウドとAzureの基礎を問うMicrosoft認定資格。クラウドの概念、Azureの主要サービス、セキュリティ・コンプライアンス・料金を扱う。