AIの社会実装と倫理・法律計算問題
ある大規模言語モデルの訓練に際し、全データセット1,000万件のうち、特定の民族グループAに関するテキストが80万件、グループBに関するテキストが10万件含まれていました。グループAのデータ比率はグループBの何倍ですか?このデータ不均衡はどのような問題を引き起こす可能性がありますか?
A.8倍、特定グループに対するバイアスと不公平性← 正解
✓ 正解です。データ比率=80万÷10万=8倍。このような不均衡は、特定グループに対する表現の偏り、バイアスを学習し、不公平で差別的な出力をもたらす恐れがあります。
B.9倍、学習速度の低下
✗ 計算が誤っています。80万÷10万=8倍であり、9倍ではありません。また、問題の本質はデータ不均衡によるバイアスです。
C.7倍、計算コストの増加
✗ 計算が誤っています。80万÷10万=8倍です。また、データ不均衡の主問題は計算コストではなく、バイアスと公平性です。
D.8倍、過学習による精度低下のみ
✗ 計算は正しい(8倍)ですが、単なる過学習だけでなく、訓練不足のグループに対するバイアスと差別的な出力が生じる可能性が高いです。
「AIの社会実装と倫理・法律」の他の問題
ある医療AI診断システムの検証データセットで、1,200人の患者のうち960人を正しく診断し、240人を誤診断しました。…あるAI採用システムの評価で、実際に優秀な候補者200人のうち160人が合格判定され、実際には不適切な候補者150人のう…ある画像認識AIの性能検証で、特定の肌色グループAに対して95%の認識精度、肌色グループBに対して72%の認識精度でした…ある信用スコア判定AIの検証で、年間処理件数が5,000件、そのうち不適切な判定が125件ありました。このシステムの誤判…ある顔認識システムの年間利用数が300万回で、そのうち誤認識による権利侵害事案が45件発生しました。また同システムの訴訟…AIの倫理と規制に関する以下の記述で、誤っているものはどれか。