生成AI応用応用

企業が顧客サポートチャットボットにAzure OpenAI Serviceを導入しました。運用開始後、LLMが顧客の過去の購買情報を含む個人データを学習データに含めてしまい、プライバシーリスクが顕在化しました。この問題を根本的に解決するために最も適切なアプローチはどれか?

A.LLMを追加のファインチューニングで個人データ対応を強化する
✗ ファインチューニングは学習データそのものをモデルに組み込むため、逆にプライバシーリスクが増加します。
B.RAG(検索拡張生成)を導入し、個人データはベクトルデータベースで安全に管理する← 正解
✓ 正解です。RAGにより学習データと検索データを分離でき、個人情報は暗号化・アクセス制御されたデータベースで管理できます。
C.プロンプトに『個人情報は扱わない』という指示を追加する
✗ プロンプト指示のみでは学習済みモデル内のデータを制御できず、根本的な解決になりません。
D.より大規模なLLMに切り替えて汎化性能を向上させる
✗ モデルサイズと個人データ漏洩リスクは関連性が低く、問題解決にはなりません。

この問題のポイント

RAGにより学習データと検索データを分離でき、個人情報は暗号化・アクセス制御されたデータベースで管理できます。

AI-900:Microsoft Azure AI Fundamentals の問題一覧