Microsoft Fabric計算

Fabricのパイプラインで、データセットAの行数は650,000行、データセットBの行数は428,000行です。両データセット間で重複するレコードが98,000行ある場合、統合後の合計ユニークレコード数は何行ですか?

A.約950,000行
✗ 計算誤りです。重複を完全に無視しています。650,000 + 428,000では重複カウントになります。
B.約980,000行← 正解
✓ 正解です。650,000 + 428,000 - 98,000 = 980,000行。重複分を引くことでユニーク数が算出できます。
C.約1,000,000行
✗ 計算誤りです。重複行数の計算が異なります。98,000ではなく別の値で計算していますね。
D.約1,078,000行
✗ 計算誤りです。重複を加算してしまっています。重複行数は足すのではなく引く必要があります。

この問題のポイント

650,000 + 428,000 - 98,000 = 980,000行。重複分を引くことでユニーク数が算出できます。

DP-900:Microsoft Azure Data Fundamentals の問題一覧