マルチモーダルAIモデル（例：GPT-4V）の「マルチモーダル」が意味するのはどれか？ | AI-900：Microsoft Azure AI Fundamentals

生成AI詳細定義問題

マルチモーダルAIモデル（例：GPT-4V）の「マルチモーダル」が意味するのはどれか？

A.複数言語のテキストを処理できること

✗ 多言語対応は重要な機能だがマルチモーダルの定義ではない。

B.テキスト・画像・音声など複数の入出力形式を扱えること← 正解

✓ 正解。マルチモーダルはテキスト・画像・音声・動画など異なるモダリティを統合して入出力できること。

C.複数のGPUで並列処理できること

✗ 並列処理は技術的実装の話でモダリティとは別の概念。

D.複数のAPIバージョンをサポートすること

✗ APIバージョン管理はバージョニングの話でモダリティとは無関係。

「生成AI詳細」の他の問題

AWS Certified Cloud Practitioner（CLF-C02）

AWSクラウドの入門資格。クラウドの概念・AWSのコアサービス・セキュリティ・料金モデルを問う。

AWS Certified Solutions Architect - Associate（SAA-C03）

AWSでのシステム設計能力を問うアソシエイト資格。高可用性・セキュリティ・コスト最適化の設計が中心。

DP-900：Microsoft Azure Data Fundamentals

Azureのデータサービスの基礎を問うMicrosoft認定資格。リレーショナル/非リレーショナルデータ、分析ワークロード、コアのデータ概念を扱う。