Azureデータ分析定義問題

Azure Data FactoryのData Flow(データフロー)とPipeline(パイプライン)の違いとして正しいのはどれか?

A.Data Flowはパイプラインの実行スケジュールを設定する機能で、Pipelineはデータ変換を行う
✗ 逆。スケジュールはADFのトリガー機能が担い、Data Flowはデータ変換ロジックを定義するもの。Pipelineはオーケストレーション。
B.Data FlowはGUIでのデータ変換機能。PipelineはData Flowを含む複数アクティビティのオーケストレーション← 正解
✓ 正解。Mapping Data FlowはSpark上で実行されるコードレスのGUIベースのデータ変換機能(フィルタ・JOIN・集計・列変換など)。PipelineはData Flow・Copy Activity・Stored Procedure Activityなど複数のアクティビティを繋ぐオーケストレーションの仕組み。
C.Data FlowとPipelineは同一の機能であり、使い方が異なるだけ
✗ Data FlowはPipeline内のアクティビティの一つとして使用される。同一機能ではなく役割が異なる。
D.Data Flowは一般的なELTに使用し、PipelineはML推論専用
✗ Data FlowはML推論専用ではなく、汎用のデータ変換に使われる。

DP-900:Microsoft Azure Data Fundamentals の問題一覧