データの基礎応用
小売チェーンが「売上ファクトテーブル(毎日1000万行)」と「商品ディメンション(商品ID・商品名・カテゴリ・単価・仕入先)」を持つスタースキーマを運用しています。ある商品の仕入先が6ヶ月前に変更されたとき、当該商品ID='P99999'について「6ヶ月間、新仕入先での売上が本当は100万円だったが、旧仕入先の100万円として集計されていた」ことが判明しました。このシナリオで、正規化スキーマではなく、SCD Type 2(緩やかに変化するディメンション タイプ2)を採用していた場合、対応効率にどのような利点が期待されるか?
A.過去のファクトテーブルをそのまま活用でき、修正SQLの実行だけで解決される
✗ SCD Type 2では過去のファクトデータはそのままで、ディメンション側に新規レコードを追加しているため、ファクトの修正が別途必要です。
B.商品ディメンションに新規レコード(同じ商品IDで異なる仕入先)を追加済みであり、既に正確な売上集計が可能になっている← 正解
✓ 正解です。SCD Type 2では変更日時と共に新規ディメンションレコードが追加されており、変更後の売上は正確に集計済みです。修正対象は変更日前の旧レコード紐付け分のみになり、手作業を最小化できます。
C.自動的に過去6ヶ月のデータが修正され、手作業がまったく不要になる
✗ SCD Type 2は過去のファクトテーブルを自動修正しません。ディメンション側の新規レコード追加のみが自動で、ファクト修正は手動です。
D.仕入先変更の日付がメタデータに記録されているため、変更前後の売上比較分析が容易になる
✗ メタデータ記録はあっても、自動的に過去売上の正確性が修正されるわけではなく、修正SQLの作成・検証が必要です。
この問題のポイント
SCD Type 2では変更日時と共に新規ディメンションレコードが追加されており、変更後の売上は正確に集計済みです。修正対象は変更日前の旧レコード紐付け分のみになり、手作業を最小化できます。
「データの基礎」の他の問題
ある製造工場がQC検査ラインで以下4種類のデータを収集しています。「半構造化データ」に分類されるのはどれか?ある銀行が2つのシステムを運用しています。①ATM出金処理(毎秒数千件・ACID保証必須・即時応答)と②全支店の月次収益…あるECサイトが「注文を受けた瞬間に在庫を引き当て、15秒以内に在庫不足アラートを送信する」要件を持っています。最も適し…データパイプラインの設計で「生データのままAzure Synapse Analyticsへロードし、Synapseの大規…ネット銀行が「A口座から1万円引き落とし」と「B口座に1万円入金」を同一トランザクション内で実行中にシステム障害が発生し…注文管理テーブルに「注文ID・顧客名・顧客住所・商品名・商品単価・数量」が1テーブルに入っており、同一顧客が別注文をする…
IT・クラウド の関連資格
AWS Certified Cloud Practitioner(CLF-C02)
AWSクラウドの入門資格。クラウドの概念・AWSのコアサービス・セキュリティ・料金モデルを問う。
AWS Certified Solutions Architect - Associate(SAA-C03)
AWSでのシステム設計能力を問うアソシエイト資格。高可用性・セキュリティ・コスト最適化の設計が中心。
AZ-900:Microsoft Azure Fundamentals
クラウドとAzureの基礎を問うMicrosoft認定資格。クラウドの概念、Azureの主要サービス、セキュリティ・コンプライアンス・料金を扱う。