難問チャレンジ応用
RAGシステムにおいて、検索したドキュメントのテキストを言語モデルに入力する際に「Context Window(コンテキストウィンドウ)」の制限に達するケースが頻繁に発生する場合、どのような対策が最も効果的か?
A.すべてのドキュメントを無条件に切り詰めて短縮し、モデルに入力する
✗ 無条件の切り詰めは重要な情報を失う可能性があり、品質低下につながります。
B.ドキュメントの関連性スコアに基づいて段階的に取捨選択し、最も重要な情報のみを優先的に含める← 正解
✓ 正解です。関連性スコアに基づく優先順位付けは、限定的なコンテキスト内で最大効果を実現します。
C.コンテキストウィンドウの制限を無視して、すべてのドキュメントを含める
✗ コンテキストウィンドウ超過は技術的なエラーとなり、実現不可能です。
D.言語モデルの出力トークン数を制限することで、自動的に入力の容量制限が解決される
✗ 出力トークン制限は入力容量とは別問題で、この対策では解決になりません。
この問題のポイント
関連性スコアに基づく優先順位付けは、限定的なコンテキスト内で最大効果を実現します。
「難問チャレンジ」の他の問題
Azure MLのAutoMLで「分類タスク」を実行する際、不均衡データへの対処として自動的に行われることはどれか?「Transformer」の「Self-Attention」メカニズムが解決した従来のRNNの問題はどれか?RAGシステムで「ユーザーの質問に最も関連する文書を検索する」際に使うベクターの種類はどれか?Azure OpenAI Serviceのデプロイメント設定で「TPM(Tokens Per Minute)」と「RPM…「Differential Privacy(差分プライバシー)」をMLに適用する主な目的はどれか?Azure MLの「Prompt flow」を使うのに最も適したユースケースはどれか?
IT・クラウド の関連資格
AWS Certified Cloud Practitioner(CLF-C02)
AWSクラウドの入門資格。クラウドの概念・AWSのコアサービス・セキュリティ・料金モデルを問う。
AWS Certified Solutions Architect - Associate(SAA-C03)
AWSでのシステム設計能力を問うアソシエイト資格。高可用性・セキュリティ・コスト最適化の設計が中心。
DP-900:Microsoft Azure Data Fundamentals
Azureのデータサービスの基礎を問うMicrosoft認定資格。リレーショナル/非リレーショナルデータ、分析ワークロード、コアのデータ概念を扱う。