データの基礎応用

小売チェーンが「売上ファクトテーブル(毎日1000万行)」と「商品ディメンション(商品ID・商品名・カテゴリ・単価・仕入先)」を持つスタースキーマを運用しています。ある商品の仕入先が6ヶ月前に変更されたとき、当該商品ID='P99999'について「6ヶ月間、新仕入先での売上が本当は100万円だったが、旧仕入先の100万円として集計されていた」ことが判明しました。このシナリオで、正規化スキーマではなく、SCD Type 2(緩やかに変化するディメンション タイプ2)を採用していた場合、対応効率にどのような利点が期待されるか?

A.過去のファクトテーブルをそのまま活用でき、修正SQLの実行だけで解決される
✗ SCD Type 2では過去のファクトデータはそのままで、ディメンション側に新規レコードを追加しているため、ファクトの修正が別途必要です。
B.商品ディメンションに新規レコード(同じ商品IDで異なる仕入先)を追加済みであり、既に正確な売上集計が可能になっている← 正解
✓ 正解です。SCD Type 2では変更日時と共に新規ディメンションレコードが追加されており、変更後の売上は正確に集計済みです。修正対象は変更日前の旧レコード紐付け分のみになり、手作業を最小化できます。
C.自動的に過去6ヶ月のデータが修正され、手作業がまったく不要になる
✗ SCD Type 2は過去のファクトテーブルを自動修正しません。ディメンション側の新規レコード追加のみが自動で、ファクト修正は手動です。
D.仕入先変更の日付がメタデータに記録されているため、変更前後の売上比較分析が容易になる
✗ メタデータ記録はあっても、自動的に過去売上の正確性が修正されるわけではなく、修正SQLの作成・検証が必要です。

この問題のポイント

SCD Type 2では変更日時と共に新規ディメンションレコードが追加されており、変更後の売上は正確に集計済みです。修正対象は変更日前の旧レコード紐付け分のみになり、手作業を最小化できます。

DP-900:Microsoft Azure Data Fundamentals の問題一覧