Azureデータ分析定義問題

あるグローバル製造企業がデータ分析環境を構築します。「PythonとScalaでETLとMLモデルを開発するデータエンジニア」「R・Pythonで実験的モデリングをするデータサイエンティスト」「Notebookベースのコラボレーションを重視」「GitLab CIとの統合でML CI/CDを実現」「GPUでのディープラーニング訓練が必要」という要件があります。最適なサービスはどれか?

A.Azure Synapse Analytics(Apache Sparkプール)
✗ Synapse Sparkプールはコラボ・Git統合・MLflowが相対的に制限的で、GPUクラスターの設定もDatabricksほど柔軟ではない。
B.Azure Databricks← 正解
✓ 正解。Azure DatabricksはコラボレーティブなNotebook環境・Git統合(Repos機能)・マネージドMLflow・GPU対応クラスター・Python/Scala/R対応を統合的に提供する。
C.Azure Machine Learning(Compute Cluster)
✗ Azure MLはモデルのトレーニングとデプロイに優れるが、データエンジニアリングETL開発・コラボNotebookの体験がDatabricksより劣る。
D.Azure HDInsight(Spark)
✗ HDInsightはコラボレーション機能・GPU対応が弱く、現代的なMLOpsワークフローとの統合が困難。

DP-900:Microsoft Azure Data Fundamentals の問題一覧