Embedding APIを使用して、企業内ドキュメント検索システムを構築しています。te… | AI-900：Microsoft Azure AI Fundamentals

生成AI詳細応用

Embedding APIを使用して、企業内ドキュメント検索システムを構築しています。text-embedding-ada-002モデルを選択する際、より大きなEmbedding次元数（1536次元）を使用することのトレードオフとして、最も重大な影響はどれか？

A.Embedding生成の精度は向上するが、ベクトル保存に必要なストレージとメモリが増加し、検索レイテンシが悪化する可能性がある← 正解

✓ 正解です。高次元のEmbeddingはより多くの情報を保持しますが、ストレージ、メモリ、計算コストが増加し、ベクトル類似度計算のレイテンシが増加するトレードオフがあります。

B.セマンティック類似度の計算精度が低下し、関連ドキュメントの検索結果が減少する

✗ むしろ次元数の増加は精度向上につながります。低下ではなく、より詳細な意味情報を捉えられます。

C.Embeddingモデルの学習時間が延長され、デプロイまでの時間が大幅に増加する

✗ text-embedding-ada-002は事前学習済みモデルのため、次元数変更では学習時間は発生しません。

D.多言語対応性が失われ、日本語ドキュメントのEmbeddingが生成できなくなる

✗ text-embedding-ada-002は次元数に関わらず多言語対応です。次元数の変更で言語対応が失われることはありません。

この問題のポイント

高次元のEmbeddingはより多くの情報を保持しますが、ストレージ、メモリ、計算コストが増加し、ベクトル類似度計算のレイテンシが増加するトレードオフがあります。

「生成AI詳細」の他の問題

AWS Certified Cloud Practitioner（CLF-C02）

AWSクラウドの入門資格。クラウドの概念・AWSのコアサービス・セキュリティ・料金モデルを問う。

AWS Certified Solutions Architect - Associate（SAA-C03）

AWSでのシステム設計能力を問うアソシエイト資格。高可用性・セキュリティ・コスト最適化の設計が中心。

DP-900：Microsoft Azure Data Fundamentals

Azureのデータサービスの基礎を問うMicrosoft認定資格。リレーショナル/非リレーショナルデータ、分析ワークロード、コアのデータ概念を扱う。