データの基礎応用
製造企業が「5年分のセンサー計測データ(500GB、1000万行のセンサーID列あり)」を履歴管理テーブルに保有しており、「直近7日間のセンサーID='SENSOR_12345'のデータ検索」が頻繁に実行されます。現在、全データに対してセンサーID列の非クラスタ化インデックスが設定されていますが、クエリ時間が30秒かかっています。このテーブルに「計測日時によるレンジパーティショニング(月単位)」を適用した場合、最も期待される改善効果はどれか?
A.インデックス効率が改善され、検索時間が5秒程度に短縮される
✗ インデックス効率自体は改善されず、むしろパーティション排除による物理的スキャン範囲の削減が主効果です。
B.パーティション排除により直近1ヶ月分(約42GB)のみがスキャン対象になり、大幅な性能向上が期待される← 正解
✓ 正解です。直近7日のデータは月単位パーティション(直近2パーティション程度)に限定され、500GBから数GBへのスキャン対象削減が劇的な高速化を実現します。
C.5年分全体を自動的に圧縮し、メモリ使用量が半減する
✗ パーティショニングは圧縮と異なり、データサイズ自体を削減しません。
D.パーティショニングにより自動的にセンサーID列の統計情報が更新され、クエリオプティマイザが最適化される
✗ パーティショニングは統計情報更新メカニズムではなく、物理的なデータ分割です。
この問題のポイント
直近7日のデータは月単位パーティション(直近2パーティション程度)に限定され、500GBから数GBへのスキャン対象削減が劇的な高速化を実現します。
「データの基礎」の他の問題
ある製造工場がQC検査ラインで以下4種類のデータを収集しています。「半構造化データ」に分類されるのはどれか?ある銀行が2つのシステムを運用しています。①ATM出金処理(毎秒数千件・ACID保証必須・即時応答)と②全支店の月次収益…あるECサイトが「注文を受けた瞬間に在庫を引き当て、15秒以内に在庫不足アラートを送信する」要件を持っています。最も適し…データパイプラインの設計で「生データのままAzure Synapse Analyticsへロードし、Synapseの大規…ネット銀行が「A口座から1万円引き落とし」と「B口座に1万円入金」を同一トランザクション内で実行中にシステム障害が発生し…注文管理テーブルに「注文ID・顧客名・顧客住所・商品名・商品単価・数量」が1テーブルに入っており、同一顧客が別注文をする…
IT・クラウド の関連資格
AWS Certified Cloud Practitioner(CLF-C02)
AWSクラウドの入門資格。クラウドの概念・AWSのコアサービス・セキュリティ・料金モデルを問う。
AWS Certified Solutions Architect - Associate(SAA-C03)
AWSでのシステム設計能力を問うアソシエイト資格。高可用性・セキュリティ・コスト最適化の設計が中心。
AZ-900:Microsoft Azure Fundamentals
クラウドとAzureの基礎を問うMicrosoft認定資格。クラウドの概念、Azureの主要サービス、セキュリティ・コンプライアンス・料金を扱う。