生成AIと大規模言語モデル応用問題

ファインチューニング後のLLMが、訓練データに含まれた特定の意見や属性に対するバイアスを継承していることが発見された場合、このバイアスを軽減するための最も効果的なアプローチはどれか?

A.推論時の温度パラメータを大幅に上げて、多様な出力を生成させる
✗ 温度の調整は出力の多様性は増すが、訓練データに組み込まれたバイアスの根本原因には対処できない。
B.訓練データを再検査して、バイアスを含む事例を削除または再バランスし、新たにファインチューニングを実行する← 正解
✓ 正解です。バイアスの根本原因はデータに由来するため、訓練データの品質確保と再バランスが最も効果的で、その後の再ファインチューニングが必要です。
C.ファインチューニング済みモデルに対してプロンプトエンジニアリングで指示を強化する
✗ プロンプトエンジニアリングは表面的な対処であり、モデルの内部的なバイアスは除去できない。
D.モデルの出力層の重みを手動で調整して、特定の属性への応答確率を下げる
✗ 出力層の重みを手動調整することは技術的に不安定で、他の能力を損なう可能性が高い。

G検定(深層学習・ジェネラリスト検定) の問題一覧