生成AIモデルに対して「プロンプトインジェクション攻撃」が成功した場合、どのような状況が発… | AWS Certified AI Practitioner（AIF-C01）

生成AIの基礎応用

生成AIモデルに対して「プロンプトインジェクション攻撃」が成功した場合、どのような状況が発生する可能性が最も高いですか？

A.モデルのパラメータが書き換えられ、永続的にモデルの挙動が変化する

✗ プロンプトインジェクションは推論時の入力操作であり、モデルのパラメータを変更することはできません。

B.悪意ある指示をプロンプトに埋め込むことで、モデルが開発者の設定した制約やシステムプロンプトを無視した動作をする← 正解

✓ 正解です。プロンプトインジェクションでは悪意ある指示をユーザー入力に混入させ、システムプロンプトの制約を回避させたり意図しない出力を引き起こしたりします。

C.モデルへのAPI接続が切断され、サービス全体が停止する

✗ プロンプトインジェクションはAPI接続を切断する攻撃ではなく、出力内容の操作を目的とします。

D.モデルの学習データが外部に漏洩し、プライバシー侵害が発生する

✗ 学習データ漏洩はモデル反転攻撃や訓練データ抽出攻撃の問題であり、プロンプトインジェクションの主な影響ではありません。

この問題のポイント

プロンプトインジェクションでは悪意ある指示をユーザー入力に混入させ、システムプロンプトの制約を回避させたり意図しない出力を引き起こしたりします。

「生成AIの基礎」の他の問題

G検定（深層学習・ジェネラリスト検定）

日本ディープラーニング協会（JDLA）が主催するAI・深層学習の基礎資格。AIの概念・機械学習・ディープラーニング・生成AIの基礎を問う。2025-2026年に受験者急増中。