データの基礎応用
データエンジニアが「オンプレミスの営業管理DB(正規化済み・トランザクション性重視)」から「Azureのデータウェアハウス(複雑な分析クエリ対応)」への切り替えを検討しています。元DBの「社員テーブル・営業成績テーブル・顧客テーブル」を非正規化して1つのディメンション結合テーブルにまとめることにしました。このアプローチが招く最大のリスクはどれか?
A.データサイズが非正規化により増加し、ストレージコストが3〜5倍になる可能性がある
✗ 非正規化はストレージサイズを増加させますが、分析用DWでは許容範囲であり「最大のリスク」ではありません。
B.営業成績が同一社員で複数行存在する場合、社員情報が行ごとに重複し、更新時に不整合が生じる可能性がある← 正解
✓ 正解です。同一社員の複数営業成績行で社員情報が重複し、名前変更時に部分更新しか反映されないアノマリが発生します。
C.複雑な分析クエリの実行時間が逆に悪化する
✗ 非正規化は分析クエリの結合コストを削減し、むしろ性能向上が期待されます。
D.Azureサービスが正規化データしか受け付けないため、ロードに失敗する
✗ Azureのデータウェアハウスは正規化・非正規化いずれのデータも受け付けます。
この問題のポイント
同一社員の複数営業成績行で社員情報が重複し、名前変更時に部分更新しか反映されないアノマリが発生します。
「データの基礎」の他の問題
ある製造工場がQC検査ラインで以下4種類のデータを収集しています。「半構造化データ」に分類されるのはどれか?ある銀行が2つのシステムを運用しています。①ATM出金処理(毎秒数千件・ACID保証必須・即時応答)と②全支店の月次収益…あるECサイトが「注文を受けた瞬間に在庫を引き当て、15秒以内に在庫不足アラートを送信する」要件を持っています。最も適し…データパイプラインの設計で「生データのままAzure Synapse Analyticsへロードし、Synapseの大規…ネット銀行が「A口座から1万円引き落とし」と「B口座に1万円入金」を同一トランザクション内で実行中にシステム障害が発生し…注文管理テーブルに「注文ID・顧客名・顧客住所・商品名・商品単価・数量」が1テーブルに入っており、同一顧客が別注文をする…
IT・クラウド の関連資格
AWS Certified Cloud Practitioner(CLF-C02)
AWSクラウドの入門資格。クラウドの概念・AWSのコアサービス・セキュリティ・料金モデルを問う。
AWS Certified Solutions Architect - Associate(SAA-C03)
AWSでのシステム設計能力を問うアソシエイト資格。高可用性・セキュリティ・コスト最適化の設計が中心。
AZ-900:Microsoft Azure Fundamentals
クラウドとAzureの基礎を問うMicrosoft認定資格。クラウドの概念、Azureの主要サービス、セキュリティ・コンプライアンス・料金を扱う。