Azureデータ分析定義問題

Azure Databricksが「Azure HDInsight(Spark)」より優れている点として最も正確なのはどれか?

A.Azure DatabricksはHDInsightより低コストで、すべての場面でHDInsightより高速
✗ コストはワークロードや設定によって異なり、常にDatabricksが安いとは言えない。HDInsightは管理オーバーヘッドが大きい分、低コストな場合もある。
B.Azure DatabricksはコラボレーティブなNotebook環境・最適化されたSparkランタイム(Photon)・MLflow統合・クラスター自動スケーリングの面でHDInsightより優れている← 正解
✓ 正解。DatabricksはコラボNotebook・Databricks Runtime(最適化Spark)・Photonエンジン・マネージドMLflow・自動スケーリング・Gitリポジトリ統合など、データエンジニアリング・ML開発のエコシステムが充実している。HDInsightはより低レベルのHadoopエコシステム管理が必要。
C.Azure DatabricksはAzure HDInsightとは全く異なるサービスで、DatabricksはBatch処理のみをサポートする
✗ DatabricksはBatch処理だけでなくStructured Streamingでリアルタイム処理も可能。
D.Azure HDInsightはApache HiveをサポートするためDatabricksより多くのワークロードに対応できる
✗ HDInsightはHive・HBase・Kafkaなど多くのHadoopコンポーネントをサポートするが、管理の複雑さがある。ワークロードの種類はDatabricksも同等以上に対応している。

DP-900:Microsoft Azure Data Fundamentals の問題一覧