生成AIと大規模言語モデル計算問題
大規模言語モデルのパラメータ効率的なファインチューニング手法LoRAにおいて、元のウェイト行列が4096×4096、LoRA秩rが64の場合、追加されるパラメータ数(バイアスを除く)はいくつか?
A.67,108,864
✗ これは元のウェイト行列全体のパラメータ数。LoRAは秩rの行列2つを追加するため、この値は誤り。
B.524,288← 正解
✓ 正解です。LoRAは秩rの2つの行列A(d_out×r)とB(r×d_in)を追加する。計算:2×4096×64=524,288パラメータ。
C.16,777,216
✗ これはウェイト行列のパラメータ数の4倍程度であり、LoRAの追加パラメータ計算ではない。
D.33,554,432
✗ 元のウェイト行列のパラメータ数と同じオーダーであり、LoRAの効率性を反映していない。