Azure非リレーショナル定義問題

ビッグデータ分析チームがAzure DatabricksとAzure Synapse Analyticsを使って大規模なデータを処理します。「フォルダー階層で整理した/year=2024/month=01/形式のデータ管理」「フォルダー単位のPOSIX準拠ACL」「Hadoopエコシステム(ABFSプロトコル)との互換性」が必要です。最適なストレージはどれか?

A.Azure Blob Storage(LRS冗長、ホットアクセス層)
✗ Blob Storageは仮想ディレクトリ(プレフィックス)であり、真の階層構造やPOSIX ACLをサポートしない。大規模分析では階層名前空間のないBlobは効率が劣る。
B.Azure Data Lake Storage Gen2(階層名前空間を有効化)← 正解
✓ 正解。ADLS Gen2の階層名前空間(Hierarchical Namespace)を有効にすることで、フォルダー階層の効率的な操作・POSIX準拠ACL・Hadoop互換FSプロトコル(ABFS)を利用できる。DatabricksおよびSynapseとの深い統合も提供。
C.Azure Files(SMBプロトコル)
✗ Azure FilesはSMBファイル共有であり、ビッグデータ分析用途には設計されていない。
D.Azure Queue Storage
✗ Azure Queue Storageはメッセージキューサービスでありデータレイクには使わない。

DP-900:Microsoft Azure Data Fundamentals の問題一覧