難問・アンチパターン誤り発見

Azure Data Lakeを使用したデータアーキテクチャの説明について、誤っているものはどれか?

A.Azure Data Lake Storage Gen2の階層名前空間を有効にすると、ACLベースの細粒度なアクセス制御がPOSIX互換で実現できる
✓ この記述は正しい。階層名前空間はディレクトリ操作を効率化し、POSIXアクセス制御をサポートしている
B.Azure Data Lake内のデータは必ず構造化フォーマット(Parquet、Delta)で保存する必要がある← 正解
✓ 正解です。この記述が誤りで、Data Lakeは構造化・半構造化・非構造化データをすべて保存可能。CSV、JSON、テキストなど形式の制限はない
C.Azure Data Factory・Synapse Pipelineを使用してData Lake内のETL処理を実行できる
✓ この記述は正しい。Data FactoryやSynapseはData Lake上のETL処理を専門としている
D.ユーザーがAAD(Azure Active Directory)認証でData Lake Storageにアクセスする際、ロールベースアクセス制御(RBAC)とACLの両方が評価される
✓ この記述は正しい。RBACとACLの両方が存在し、より厳しい制限が適用される

この問題のポイント

この記述が誤りで、Data Lakeは構造化・半構造化・非構造化データをすべて保存可能。CSV、JSON、テキストなど形式の制限はない

DP-900:Microsoft Azure Data Fundamentals の問題一覧