自然言語処理タスクで、訓練データが極めて限定的な場合、次のうちどのアプローチが最も実用的で… | G検定（深層学習・ジェネラリスト検定） | 資格もん

資格もん/G検定（深層学習・ジェネラリスト検定）/問題 28

AIの基礎概念と歴史応用

自然言語処理タスクで、訓練データが極めて限定的な場合、次のうちどのアプローチが最も実用的ですか？

A.ニューラルネットワークを小規模に設計し、パラメータ数を最小化してから一から訓練する

✗ 小規模モデルでも訓練データが少ないと、汎化性能が低下します。事前学習の利点が活用できません。

B.大規模な汎用言語モデル（BERTやGPTなど）で事前学習済みのモデルを利用し、少量データで微調整する← 正解

✓ 正解です。事前学習済みモデルは言語の普遍的な特徴を既に習得しており、少量データでの微調整が有効です。

C.古典的な統計的手法（TF-IDF、ナイーブベイズ）だけを使い、ニューラルネットワークは避ける

✗ ニューラルネットワークは高い表現能力を持ち、古典的手法より有利です。除外する理由はありません。

D.訓練データを人工的にランダムに拡張（ノイズ追加）して、訓練サンプル数を増やす

✗ ランダムなノイズ追加はデータ品質を低下させ、かえって学習を阻害する可能性があります。

この問題のポイント

事前学習済みモデルは言語の普遍的な特徴を既に習得しており、少量データでの微調整が有効です。

⚠ この問題の誤りを報告

← 前の問題練習を始める次の問題 →

「AIの基礎概念と歴史」の他の問題

機械学習モデルが訓練データに過度に適合し、テストデータでの性能が低下した場合、このような状況を改善するためには、次のうち…深層学習モデルが新しいドメイン（異なるデータ分布）に対応する際、事前学習済みモデルを使用した転移学習を適用する場合、モデ…勾配消失問題が発生している深層ニューラルネットワークを改善する場合、次のうちどの施策の組み合わせが最も効果的ですか？画像分類モデルが特定のクラスに対して極めて高い確信度（90%以上の予測確率）を返しても、実際には予測が外れている場合が頻…時系列予測タスクで、長期的な依存関係を捉える際に通常のLSTMが困難を示した場合、改善策として最も適切なのはどれですか？機械学習モデルの訓練データが8,000サンプル、検証データが2,000サンプル、テストデータが1,000サンプルの場合、…

IT・AI の関連資格

AWS Certified AI Practitioner（AIF-C01）

AWSにおけるAI・ML・生成AIサービスの基礎知識を問う新資格。AIの概念からAWSのAIサービスまで幅広く出題。

G検定（深層学習・ジェネラリスト検定）の問題一覧

31 32 33 34 35 36 103 104 105 106 107 108 85 86 87 88 89 90 25 26 全150問 →