RAGシステムで「ユーザーの質問に最も関連する文書を検索する」際に使うベクターの種類はどれ… | AI-900：Microsoft Azure AI Fundamentals

難問チャレンジ定義問題

RAGシステムで「ユーザーの質問に最も関連する文書を検索する」際に使うベクターの種類はどれか？

A.ワンホットエンコーディングベクター

✗ カテゴリ変数のエンコーディング手法。意味的類似度の計算には不向き。

B.TF-IDFスパースベクター

✗ キーワード頻度に基づくスパースベクター。意味的な類似性（同義語など）を捉えられない。

C.Embeddingモデルが生成した密ベクター（Dense Vector）← 正解

✓ 正解。EmbeddingモデルはテキストをDense Vectorに変換し、意味的に近いテキストが空間的に近くなる特性を活用する。

D.バイナリベクター

✗ バイナリベクターは画像特徴量等に使われるが、意味的類似検索への活用は一般的でない。

「難問チャレンジ」の他の問題

AWS Certified Cloud Practitioner（CLF-C02）

AWSクラウドの入門資格。クラウドの概念・AWSのコアサービス・セキュリティ・料金モデルを問う。

AWS Certified Solutions Architect - Associate（SAA-C03）

AWSでのシステム設計能力を問うアソシエイト資格。高可用性・セキュリティ・コスト最適化の設計が中心。

DP-900：Microsoft Azure Data Fundamentals

Azureのデータサービスの基礎を問うMicrosoft認定資格。リレーショナル/非リレーショナルデータ、分析ワークロード、コアのデータ概念を扱う。