AIの基礎概念と歴史応用問題

自然言語処理タスクで、訓練データが極めて限定的な場合、次のうちどのアプローチが最も実用的ですか?

A.ニューラルネットワークを小規模に設計し、パラメータ数を最小化してから一から訓練する
✗ 小規模モデルでも訓練データが少ないと、汎化性能が低下します。事前学習の利点が活用できません。
B.大規模な汎用言語モデル(BERTやGPTなど)で事前学習済みのモデルを利用し、少量データで微調整する← 正解
✓ 正解です。事前学習済みモデルは言語の普遍的な特徴を既に習得しており、少量データでの微調整が有効です。
C.古典的な統計的手法(TF-IDF、ナイーブベイズ)だけを使い、ニューラルネットワークは避ける
✗ ニューラルネットワークは高い表現能力を持ち、古典的手法より有利です。除外する理由はありません。
D.訓練データを人工的にランダムに拡張(ノイズ追加)して、訓練サンプル数を増やす
✗ ランダムなノイズ追加はデータ品質を低下させ、かえって学習を阻害する可能性があります。

G検定(深層学習・ジェネラリスト検定) の問題一覧