難問チャレンジ定義問題

RAGシステムで「ユーザーの質問に最も関連する文書を検索する」際に使うベクターの種類はどれか?

A.ワンホットエンコーディングベクター
✗ カテゴリ変数のエンコーディング手法。意味的類似度の計算には不向き。
B.TF-IDFスパースベクター
✗ キーワード頻度に基づくスパースベクター。意味的な類似性(同義語など)を捉えられない。
C.Embeddingモデルが生成した密ベクター(Dense Vector)← 正解
✓ 正解。EmbeddingモデルはテキストをDense Vectorに変換し、意味的に近いテキストが空間的に近くなる特性を活用する。
D.バイナリベクター
✗ バイナリベクターは画像特徴量等に使われるが、意味的類似検索への活用は一般的でない。

AI-900:Microsoft Azure AI Fundamentals の問題一覧