生成AIの基礎応用問題
RAGシステムにおいて、ベクターデータベースに格納されたドキュメントのチャンクサイズを極端に小さく設定した場合、どのような問題が起きやすくなりますか?
A.検索時に意味的文脈が失われやすくなり、質問に対して断片的で不完全な情報しか取得できなくなる← 正解
✓ 正解です。チャンクが小さすぎると文章の文脈や段落単位の意味が失われ、検索で取得される情報が断片的になり回答品質が低下します。
B.チャンクが小さいほど検索精度が常に向上し、より正確な回答が生成される
✗ チャンクサイズと検索精度は単純な反比例関係ではなく、小さすぎると文脈欠如により精度が下がります。
C.ベクターデータベースへの格納に失敗し、ドキュメントをインデックス化できなくなる
✗ チャンクサイズが小さくてもインデックス化自体は可能です。格納失敗とは直接関係しません。
D.LLMのコンテキストウィンドウをすべて占有してしまい、質問プロンプトが入力できなくなる
✗ 小さなチャンクはコンテキストウィンドウの占有量を増やしますが、チャンク数の選択次第でコントロールできます。