Azure非リレーショナル定義問題

あるIoT企業が10,000台のスマートホームデバイスから温度・湿度・電力消費量を毎秒収集・保存しています。「デバイスIDと時刻をキーに毎秒10,000件の高頻度書き込み」「特定デバイスの過去30日分の時系列データ取得」が主な操作で、既存の開発チームはApache Cassandraに精通しています。最適なCosmos DBのAPIはどれか?

A.Cosmos DB(Core SQL API)― SQLクエリで時系列データを柔軟に検索
✗ Core SQL APIも技術的には可能だが、既存チームのCassandraスキルを活かせずワイドカラムの時系列最適化(Clustering Column)も使えない。
B.Cosmos DB(Table API)― キーバリュー形式でデバイスデータを管理
✗ Table APIはシンプルなキーバリューでClustering Columnの概念がなく、時系列範囲取得の最適化が弱い。
C.Cosmos DB(Cassandra API)← 正解
✓ 正解。Cassandra APIはPartition Key(デバイスID)+Clustering Column(タイムスタンプ)でソートされた時系列データの格納・範囲取得に最適化。既存チームのCQL知識を活用でき、Cosmos DBのグローバル分散・低遅延書き込みも享受できる。
D.Cosmos DB(Gremlin API)― グラフ構造でデバイス間の関係を管理
✗ Gremlin APIはグラフトラバーサル用。センサーデータの時系列管理には不適切。

DP-900:Microsoft Azure Data Fundamentals の問題一覧