Azureデータ分析定義問題
あるグローバル製造企業がデータ分析環境を構築します。「PythonとScalaでETLとMLモデルを開発するデータエンジニア」「R・Pythonで実験的モデリングをするデータサイエンティスト」「Notebookベースのコラボレーションを重視」「GitLab CIとの統合でML CI/CDを実現」「GPUでのディープラーニング訓練が必要」という要件があります。最適なサービスはどれか?
A.Azure Synapse Analytics(Apache Sparkプール)
✗ Synapse Sparkプールはコラボ・Git統合・MLflowが相対的に制限的で、GPUクラスターの設定もDatabricksほど柔軟ではない。
B.Azure Databricks← 正解
✓ 正解。Azure DatabricksはコラボレーティブなNotebook環境・Git統合(Repos機能)・マネージドMLflow・GPU対応クラスター・Python/Scala/R対応を統合的に提供する。
C.Azure Machine Learning(Compute Cluster)
✗ Azure MLはモデルのトレーニングとデプロイに優れるが、データエンジニアリングETL開発・コラボNotebookの体験がDatabricksより劣る。
D.Azure HDInsight(Spark)
✗ HDInsightはコラボレーション機能・GPU対応が弱く、現代的なMLOpsワークフローとの統合が困難。
「Azureデータ分析」の他の問題
あるデータアナリストチームがADLS Gen2上のParquet形式ログデータ(総容量10TB)に対して月20回程度のア…ある金融企業が「オンプレミスOracleからの日次スナップショット抽出」→「日次集計・通貨換算・NULLクレンジング変換…ある物流会社が配送トラック1,000台のGPSデータをリアルタイムで処理し、「配送遅延を発生から30秒以内に検知してアラ…ある小売企業のCFOがAzure SQL Databaseの売上データを使ったダッシュボードを要求しています。「常に最新…Power BIのImportモードとDirectQueryモードを比較したとき、「大規模データセット(1億行)に対して…ある企業が毎秒100万件のIoTイベントを複数のシステムから受信する必要があります。「同じイベントをAzure Stre…
IT・クラウド の関連資格
AWS Certified Cloud Practitioner(CLF-C02)
AWSクラウドの入門資格。クラウドの概念・AWSのコアサービス・セキュリティ・料金モデルを問う。
AWS Certified Solutions Architect - Associate(SAA-C03)
AWSでのシステム設計能力を問うアソシエイト資格。高可用性・セキュリティ・コスト最適化の設計が中心。
AZ-900:Microsoft Azure Fundamentals
クラウドとAzureの基礎を問うMicrosoft認定資格。クラウドの概念、Azureの主要サービス、セキュリティ・コンプライアンス・料金を扱う。