ファインチューニング後のLLMが、訓練データに含まれた特定の意見や属性に対するバイアスを継… | G検定（深層学習・ジェネラリスト検定）

生成AIと大規模言語モデル応用

ファインチューニング後のLLMが、訓練データに含まれた特定の意見や属性に対するバイアスを継承していることが発見された場合、このバイアスを軽減するための最も効果的なアプローチはどれか？

A.推論時の温度パラメータを大幅に上げて、多様な出力を生成させる

✗ 温度の調整は出力の多様性は増すが、訓練データに組み込まれたバイアスの根本原因には対処できない。

B.訓練データを再検査して、バイアスを含む事例を削除または再バランスし、新たにファインチューニングを実行する← 正解

✓ 正解です。バイアスの根本原因はデータに由来するため、訓練データの品質確保と再バランスが最も効果的で、その後の再ファインチューニングが必要です。

C.ファインチューニング済みモデルに対してプロンプトエンジニアリングで指示を強化する

✗ プロンプトエンジニアリングは表面的な対処であり、モデルの内部的なバイアスは除去できない。

D.モデルの出力層の重みを手動で調整して、特定の属性への応答確率を下げる

✗ 出力層の重みを手動調整することは技術的に不安定で、他の能力を損なう可能性が高い。

この問題のポイント

バイアスの根本原因はデータに由来するため、訓練データの品質確保と再バランスが最も効果的で、その後の再ファインチューニングが必要です。

「生成AIと大規模言語モデル」の他の問題

AWS Certified AI Practitioner（AIF-C01）

AWSにおけるAI・ML・生成AIサービスの基礎知識を問う新資格。AIの概念からAWSのAIサービスまで幅広く出題。