生成AIと大規模言語モデル誤り発見

以下の記述で誤っているものはどれか。

A.トランスフォーマーはエンコーダ-デコーダ構造を採用しており、自己注意機構によって入力シーケンスの依存関係を効率的に学習できる。
✓ この記述は正しい。トランスフォーマーは自己注意機構で並列処理を実現し、長距離依存を学習できる。
B.GPTシリーズは双方向コンテキストを活用するため、BERT同様にマスク言語モデリングのみで学習されている。← 正解
✓ 正解です。この記述が誤りで、GPTは単方向(左から右)の因果的言語モデリングで学習され、BERTが双方向マスク言語モデリングを採用しています。
C.微調整(ファインチューニング)により、事前学習済みモデルは特定の下流タスクに効率的に適応させることができる。
✓ この記述は正しい。微調整は転移学習の重要なテクニックであり、パラメータ効率を高める。
D.トークン化は生のテキストを数値表現に変換するプロセスであり、言語モデルの入力として不可欠である。
✓ この記述は正しい。トークン化なしに言語モデルは入力を処理できない基本ステップである。

G検定(深層学習・ジェネラリスト検定) の問題一覧