Azureサービス深掘り定義問題

Azure Synapse Analytics Dedicated SQL Poolのデータ分散戦略で「小さなテーブル(ディメンションテーブル)を全ノードにコピーして大きなテーブルとのJOINを高速化する」分散方式はどれか?

A.HASH分散(Hash Distribution)
✗ HASH分散は指定した列のハッシュ値で行を特定のノードに分散させる。大規模ファクトテーブルに適している。
B.ROUND_ROBIN分散(Round-Robin Distribution)
✗ ROUND_ROBIN分散は行を順番にノードに振り分ける。均等に分散されるが結合時にデータ移動が発生しやすい。
C.REPLICATE(レプリケーション)← 正解
✓ 正解。REPLICATE(レプリケーション)は小さなテーブル全体を全計算ノードにコピーする分散方式。全ノードがローカルにコピーを持つため、HASH分散のファクトテーブルとのJOIN時のデータ移動がなくなり高速化される。
D.PARTITION(パーティション)
✗ PARTITIONはテーブルをパーティション列値で分割する機能。分散ノードへの行の割り当て方式とは異なる概念。

DP-900:Microsoft Azure Data Fundamentals の問題一覧