責任あるAIと倫理誤り発見

AIシステムにおける「敵対的攻撃(Adversarial Attack)」に関する以下の記述のうち、誤っているものはどれか?

A.敵対的攻撃とは、AIモデルが誤った予測や分類を行うよう、入力データに意図的な微小な摂動を加える手法である。
✓ この記述は正しい。敵対的攻撃は微小な入力改ざんによってモデルを欺く手法であり、AIセキュリティ上の重大な脅威である。
B.敵対的サンプル(Adversarial Examples)は、人間の目には元の入力とほぼ区別できないにもかかわらず、モデルに誤分類を引き起こす場合がある。
✓ この記述は正しい。敵対的サンプルは人間には気づかれにくいが、モデルには誤分類を誘発させるという非直感的な特性を持つ。
C.敵対的攻撃への対策として、敵対的訓練(Adversarial Training)と呼ばれる、敵対的サンプルを訓練データに含める手法が有効とされている。
✓ この記述は正しい。敵対的訓練はモデルの堅牢性を向上させる代表的な防御手法として広く研究されている。
D.敵対的攻撃はモデルの構造や重みが完全に公開されているホワイトボックス設定でのみ成立し、モデル内部が非公開のブラックボックス設定では実行不可能である。← 正解
✓ 正解です。この記述が誤りで、正しくはブラックボックス設定でも出力結果を利用した転移攻撃やクエリベース攻撃により敵対的攻撃は実行可能である。

AWS Certified AI Practitioner(AIF-C01) の問題一覧