データの基礎応用

製造企業が「5年分のセンサー計測データ(500GB、1000万行のセンサーID列あり)」を履歴管理テーブルに保有しており、「直近7日間のセンサーID='SENSOR_12345'のデータ検索」が頻繁に実行されます。現在、全データに対してセンサーID列の非クラスタ化インデックスが設定されていますが、クエリ時間が30秒かかっています。このテーブルに「計測日時によるレンジパーティショニング(月単位)」を適用した場合、最も期待される改善効果はどれか?

A.インデックス効率が改善され、検索時間が5秒程度に短縮される
✗ インデックス効率自体は改善されず、むしろパーティション排除による物理的スキャン範囲の削減が主効果です。
B.パーティション排除により直近1ヶ月分(約42GB)のみがスキャン対象になり、大幅な性能向上が期待される← 正解
✓ 正解です。直近7日のデータは月単位パーティション(直近2パーティション程度)に限定され、500GBから数GBへのスキャン対象削減が劇的な高速化を実現します。
C.5年分全体を自動的に圧縮し、メモリ使用量が半減する
✗ パーティショニングは圧縮と異なり、データサイズ自体を削減しません。
D.パーティショニングにより自動的にセンサーID列の統計情報が更新され、クエリオプティマイザが最適化される
✗ パーティショニングは統計情報更新メカニズムではなく、物理的なデータ分割です。

この問題のポイント

直近7日のデータは月単位パーティション(直近2パーティション程度)に限定され、500GBから数GBへのスキャン対象削減が劇的な高速化を実現します。

DP-900:Microsoft Azure Data Fundamentals の問題一覧