実戦シナリオ定義問題
あるグローバルECサイトがデータパイプラインを設計します。「毎日深夜にオンプレミスのSAP ERPシステムから売上データをAzureに転送(バッチ)」「ADLS Gen2に蓄積されたデータをAzure Databricksで機械学習用に前処理」「学習済みモデルをAzure Machine Learningに登録・デプロイ」という3段階のパイプラインのオーケストレーションに最適なサービスはどれか?
A.Azure Stream Analytics(3段階すべてをリアルタイムで処理)
✗ Stream AnalyticsはリアルタイムストリームSQL処理用。バッチのERP転送・ML前処理のオーケストレーションには使わない。
B.Azure Data Factory(パイプライン・依存関係・スケジュールを管理)← 正解
✓ 正解。Azure Data FactoryはSAP ERPを含む200以上のコネクターを持ち、ADFパイプラインのアクティビティとしてDatabricksジョブ・Azure MLパイプラインを呼び出せる。依存関係(SAPからの転送が成功したら前処理を開始)・スケジューリング(深夜バッチ)を管理できる。
C.Power BI(レポートでデータ確認後、手動でトリガー)
✗ Power BIはデータ可視化ツールであり、ETLパイプラインのオーケストレーションは行わない。
D.Azure Event Hubs(イベントドリブンに各ステップをトリガー)
✗ Event HubsはイベントIngestionサービスであり、複雑なパイプラインのステップ間の依存関係・スケジューリングのオーケストレーション機能を持たない。
「実戦シナリオ」の他の問題
あるグローバル旅行プラットフォームが以下4種類のデータを管理します。①ホテル在庫(日付×部屋タイプ×ホテルIDの空き状況…ある製造企業が「①工場のPOSシステム(オンプレミス)からADLS Gen2へのデータ転送」→「②ADLS Gen2のデ…あるヘルスケアスタートアップが患者データ管理システムをAzureに構築します。「患者基本情報(氏名・生年月日・住所)と診…あるソーシャルゲーム企業が以下のシステムを設計しています。「①ゲームサーバーからのプレイログ(毎秒500万イベント)をリ…あるECサイトが「商品ページの閲覧履歴・カートに入れた商品・購入履歴を組み合わせて、各ユーザーにパーソナライズされた商品…ある銀行がAzure SQL Databaseで取引データを管理し、「監査のために過去7年間の全取引を保持する必要がある…
IT・クラウド の関連資格
AWS Certified Cloud Practitioner(CLF-C02)
AWSクラウドの入門資格。クラウドの概念・AWSのコアサービス・セキュリティ・料金モデルを問う。
AWS Certified Solutions Architect - Associate(SAA-C03)
AWSでのシステム設計能力を問うアソシエイト資格。高可用性・セキュリティ・コスト最適化の設計が中心。
AZ-900:Microsoft Azure Fundamentals
クラウドとAzureの基礎を問うMicrosoft認定資格。クラウドの概念、Azureの主要サービス、セキュリティ・コンプライアンス・料金を扱う。