LLMをAPI経由でサービス提供する企業が、ユーザーの入力プロンプトをモデルの継続的な改善… | G検定（深層学習・ジェネラリスト検定）

生成AIと大規模言語モデル応用

LLMをAPI経由でサービス提供する企業が、ユーザーの入力プロンプトをモデルの継続的な改善に使用する際に生じるリスクとして最も重要なものはどれか？

A.ユーザーが入力したプライベート情報や機密データが誤ってモデルの訓練データに含まれ、その後の出力で漏露される可能性← 正解

✓ 正解です。ユーザー入力を訓練に使う場合、個人情報や機密データが意図せず学習され、後の出力やモデルの外部公開で再露出するリスクが最大の懸念です。

B.API呼び出し頻度が増加するため、計算コストが指数関数的に増加する

✗ 計算コストは利用量に線形または準線形で増加するが、指数関数的には増加しない。また、これは改善利用時の主要リスクではない。

C.ユーザーの質問内容から作成されたデータセットがバイアスを持つようになり、多様性が低下する

✗ 確かにユーザープロンプトにはバイアスがある可能性があるが、これは適切なデータフィルタリングで対処可能。プライバシー漏露ほど重篤ではない。

D.プロンプトインジェクション攻撃が増加し、モデルの出力が制御不能になる

✗ プロンプトインジェクション攻撃は重要だが、訓練データ利用とは別の問題。継続的改善時の主要リスクではない。

この問題のポイント

ユーザー入力を訓練に使う場合、個人情報や機密データが意図せず学習され、後の出力やモデルの外部公開で再露出するリスクが最大の懸念です。

「生成AIと大規模言語モデル」の他の問題

AWS Certified AI Practitioner（AIF-C01）

AWSにおけるAI・ML・生成AIサービスの基礎知識を問う新資格。AIの概念からAWSのAIサービスまで幅広く出題。