データの基礎定義問題

あるIT部門が「あらゆる形式のデータを生のまま一元的に蓄積し、後でどう活用するか決める」戦略を取ろうとしています。この戦略に対応するデータ蓄積アーキテクチャはどれか?

A.データウェアハウス(事前定義スキーマが必要)
✗ データウェアハウスはデータをロード前にスキーマを定義する(スキーマオンライト)。生のまま格納してから使い方を決めるスタイルに不向き。
B.データマート(特定部門向けのサブセット)
✗ データマートはデータウェアハウスから特定用途向けに切り出したサブセット。一元的な蓄積の概念ではない。
C.データレイク(スキーマオンリード)← 正解
✓ 正解。データレイクは構造化・半構造化・非構造化データを生のまま格納し、スキーマオンリード(使う時にスキーマを適用)のアーキテクチャ。Azure Data Lake Storage Gen2が代表例。
D.OLTPデータベース(高頻度トランザクション向け)
✗ OLTPはリアルタイムトランザクション処理向けであり、大量の多種データを生のまま蓄積するのに適していない。

DP-900:Microsoft Azure Data Fundamentals の問題一覧