G検定(深層学習・ジェネラリスト検定) 問題一覧
全150問 · 5カテゴリ · タップで開閉
練習を始めるAIの基礎概念と歴史30問
▼
機械学習モデルが訓練データに過度に適合し、テストデータでの性能が低下した場合、このような状況を改善するためには、次のうちどの対策が最も効果的ですか?
応用26深層学習モデルが新しいドメイン(異なるデータ分布)に対応する際、事前学習済みモデルを使用した転移学習を適用する場合、モデルのどの部分を調整すべきですか?
応用27勾配消失問題が発生している深層ニューラルネットワークを改善する場合、次のうちどの施策の組み合わせが最も効果的ですか?
応用28自然言語処理タスクで、訓練データが極めて限定的な場合、次のうちどのアプローチが最も実用的ですか?
応用29画像分類モデルが特定のクラスに対して極めて高い確信度(90%以上の予測確率)を返しても、実際には予測が外れている場合が頻繁に起きています。このモデルはどのような問題を抱えていると考えられますか?
応用30時系列予測タスクで、長期的な依存関係を捉える際に通常のLSTMが困難を示した場合、改善策として最も適切なのはどれですか?
応用19機械学習モデルの訓練データが8,000サンプル、検証データが2,000サンプル、テストデータが1,000サンプルの場合、全体のデータセット中で訓練データが占める割合は何パーセントか?
計算20深層学習モデルの精度が94.5%、偽陽性率が8%の場合、真陽性率(感度)は何%か?(注:精度 = (TP + TN) / 全体、偽陽性率 = FP / (FP + TN))
計算21画像分類タスクで、1,200個のクラスAサンプルと3,600個のクラスBサンプルがあります。訓練時にクラスバランスを修正するため、少数クラスをアップサンプリングする場合、クラスAを何倍に増やす必要があるか?
計算22ニューラルネットワークの学習率が0.01で、勾配が-2.5の場合、重みの更新量はいくつか?(更新量 = 学習率 × 勾配)
計算23自然言語処理のプロジェクトで、訓練に120時間、検証に30時間、テストに15時間を要するとします。全体の処理時間うち、訓練フェーズが占める割合は?
計算24画像認識モデルが100枚の画像を処理するのに8秒要する場合、1,000枚の画像を処理するのにかかる時間は(処理時間が線形と仮定)?
計算13以下の記述で誤っているものはどれか
誤り発見14以下の記述で誤っているものはどれか
誤り発見15以下の記述で誤っているものはどれか
誤り発見16以下の記述で誤っているものはどれか
誤り発見17以下の記述で誤っているものはどれか
誤り発見18以下の記述で誤っているものはどれか
誤り発見1機械学習において、「教師あり学習」の定義として最も適切なものはどれか。
定義2ニューラルネットワークにおける「活性化関数」の役割として最も正確なものはどれか。
定義3深層学習における「過学習(オーバーフィッティング)」とは、どのような現象を指すか。
定義4機械学習における「交差検証(クロスバリデーション)」の目的として最も適切なものはどれか。
定義5深層学習における「バッチノーマライゼーション」の主な目的は何か。
定義6機械学習モデルの評価指標「精度(Accuracy)」の定義として最も正確なものはどれか。
定義7機械学習とディープラーニングの最大の違いは何か。
比較8教師あり学習と教師なし学習の根本的な違いは何か。
比較9人工知能(AI)と機械学習(ML)と深層学習(DL)の包含関係について正しいのは。
比較10ニューラルネットワークとディープニューラルネットワークの主な違いは何か。
比較11ディープラーニングにおける順伝播と逆伝播の主な役割の違いは何か。
比較12教師あり学習における分類タスクと回帰タスクの最大の違いは何か。
比較機械学習の基礎30問
▼
機械学習における「精度(Accuracy)」の定義として、最も正確なものはどれか。
定義32統計学における「過学習(Overfitting)」とは、どのような現象を指すか。
定義33ロジスティック回帰において使用される活性化関数(シグモイド関数)の出力範囲はどれか。
定義34機械学習における「交差検証(Cross-Validation)」の主な目的は何か。
定義35「正則化(Regularization)」における「L2正則化」の定義として正しいものはどれか。
定義36「勾配降下法(Gradient Descent)」における「学習率」の役割を説明したものはどれか。
定義55訓練データに対する損失は減少し続けているのに、検証データの損失が増加し始めた場合、モデルの状態はどのようになっていると考えられますか?
応用56クラス不均衡なデータセット(正例1000件、負例50000件)で、精度が99%に達したモデルについて、実際の予測性能をどのように評価すべきですか?
応用57特徴量の数が サンプル数よりはるかに多い高次元データ(特徴量10000個、サンプル200個)をロジスティック回帰で学習した場合、どのような問題が発生する可能性が高いですか?
応用58ニューラルネットワークの勾配消失問題(Vanishing Gradient Problem)が起きている場合、深いネットワークの初期層と後期層でどのような学習速度の差が生じますか?
応用59訓練データの一部に誤ラベル(ノイズ)が含まれていることに気づきました。ノイズ率が5%程度の場合、最も実務的な対応はどれですか?
応用60時系列データで、訓練データ(2020年1月~12月)でモデルを学習し、テストデータ(2021年1月~12月)で評価した結果、訓練スコアは0.95、テストスコアは0.72でした。この原因として最も妥当な説明はどれですか?
応用49訓練データで以下の結果が得られた。正解率(Accuracy)を計算してください。\n正解数:78\n不正解数:22\n合計:100
計算50混同行列から Precision(適合率)を求めてください。\n真陽性(TP):45\n偽陽性(FP):15\n真陰性(TN):120\n偽陰性(FN):20
計算51以下のデータから Recall(再現率)を計算してください。\n真陽性(TP):32\n偽陽性(FP):8\n真陰性(TN):145\n偽陰性(FN):15
計算52機械学習モデルの評価で以下の値が得られました。F1スコアを計算してください。\nPrecision:0.85\nRecall:0.90
計算53回帰モデルにおいて、以下のデータから平均二乗誤差(MSE)を計算してください。\n予測値:[3, 5, 7, 6]\n実際値:[2, 6, 7, 5]\n(小数第3位を四捨五入)
計算54分類モデルの混同行列から特異度(Specificity)を求めてください。\n真陽性(TP):50\n偽陽性(FP):10\n真陰性(TN):130\n偽陰性(FN):10
計算37教師あり学習と教師なし学習の最大の違いは何か。
比較38過学習(オーバーフィッティング)と未学習(アンダーフィッティング)の違いについて正しい説明はどれか。
比較39勾配降下法と確率的勾配降下法(SGD)の主な違いは何か。
比較40分類問題における精度(Accuracy)と再現率(Recall)の違いを説明している選択肢はどれか。
比較41回帰問題と分類問題の本質的な違いは何か。
比較42バイアス(偏り)とバリアンス(分散)の違いは何か。
比較151以下の記述で誤っているものはどれか。
誤り発見152以下の記述で誤っているものはどれか。
誤り発見153以下の記述で誤っているものはどれか。
誤り発見154以下の記述で誤っているものはどれか。
誤り発見155以下の記述で誤っているものはどれか。
誤り発見156以下の記述で誤っているものはどれか。
誤り発見深層学習(ディープラーニング)30問
▼
ニューラルネットワークの訓練中に勾配消失問題が発生した場合、以下の対策のうち最も直接的な解決策はどれか?
応用86CNN(畳み込みニューラルネットワーク)で過学習が顕著に発生した場合、以下の対策のうち最も効果的なのはどれか?
応用87RNN(再帰型ニューラルネットワーク)で長期の依存関係をモデル化する必要がある場合、標準的なRNNではなくLSTMやGRUを採用する理由は何か?
応用88画像分類タスクで訓練データセットが著しく不均衡(あるクラスが極端に少ない)な場合、モデルの性能を改善するために講じるべき対策として最も適切なのはどれか?
応用89転移学習(Transfer Learning)で大規模な事前訓練済みモデルを利用する際、目的タスクのデータが非常に少ない場合、どのような訓練戦略が最適か?
応用90自然言語処理でAttention機構を導入した結果、以前のRNNモデルと比べて並列処理性能が向上した理由は何か?
応用67CNNとRNNの最も重要な違いはどれか。
比較68バッチ正規化(Batch Normalization)とレイヤー正規化(Layer Normalization)の主な違いは何か。
比較69Dropout と Early Stopping の過学習(過適合)対策における役割の違いは。
比較70活性化関数のReLUとSigmoidの主な違いは何か。
比較72勾配降下法(Gradient Descent)とその変種であるAdam オプティマイザーの主な違いは何か。
比較79ニューラルネットワークの順伝播において、入力層のニューロン数が8、隠れ層のニューロン数が12、出力層のニューロン数が3である場合、入力層から隠れ層への重み行列のサイズ(行×列)は何か?
計算80バッチサイズが64、学習データセットが12,800サンプルの場合、1エポック当たりのバッチ数は何か?
計算81畳み込みニューラルネットワーク(CNN)において、入力サイズが28×28、カーネルサイズが5×5、パディングが0、ストライドが1である場合、出力特徴マップのサイズ(高さ×幅)は何か?
計算82ニューラルネットワークで勾配消失問題を考える際、5層の隠れ層を通じてバックプロパゲーションする場合、各層での勾配が0.9倍ずつ減少するとき、最初の層までの勾配減衰率はどの程度か?(小数第3位まで)
計算83リカレントニューラルネットワーク(RNN)のシーケンス長が30タイムステップ、隠れ状態の次元数が64である場合、各タイムステップでの重み行列W_hh(隠れ状態から隠れ状態への重み)のサイズ(行×列)は何か?
計算84ニューラルネットワークの正則化において、L2正則化(ウェイト減衰)の係数λが0.001、モデルの全重みの2乗和が45,000である場合、正則化項による損失への追加値は何か?
計算61ニューラルネットワークにおけるバックプロパゲーション(逆誤差伝播法)とは何ですか?
定義62ReLU(Rectified Linear Unit)活性化関数の数式として正しいものはどれですか?
定義64バッチノーマライゼーション(Batch Normalization)の目的として最も適切なものはどれですか?
定義65ドロップアウト(Dropout)正則化技術における停止確率 p=0.5 の意味として正しいものはどれですか?
定義66LSTM(Long Short-Term Memory)ユニットにおけるセル状態(Cell State)の役割は何ですか?
定義158フィードフォワードニューラルネットワーク(順伝播型NN)と再帰型ニューラルネットワーク(RNN)の最も本質的な違いはどれですか?
比較159以下のニューラルネットワークの基本的な特性に関する記述について、誤っているものはどれか?
誤り発見160以下の正則化とその効果に関する記述について、誤っているものはどれか?
誤り発見161以下の畳み込みニューラルネットワーク(CNN)の基本構成要素に関する記述について、誤っているものはどれか?
誤り発見162以下のRecurrent Neural Network(RNN)と関連手法に関する記述について、誤っているものはどれか?
誤り発見163以下の正規化手法とその特性に関する記述について、誤っているものはどれか?
誤り発見164以下の最適化アルゴリズムとその特性に関する記述について、誤っているものはどれか?
誤り発見157ニューラルネットワークにおける「勾配爆発(Gradient Explosion)」とは何ですか?
定義生成AIと大規模言語モデル30問
▼
以下の記述で誤っているものはどれか。
誤り発見104以下の記述で誤っているものはどれか。
誤り発見105以下の記述で誤っているものはどれか。
誤り発見106以下の記述で誤っているものはどれか。
誤り発見107以下の記述で誤っているものはどれか。
誤り発見108以下の記述で誤っているものはどれか。
誤り発見109トランスフォーマー模型の自己注意機構において、クエリ行列Q、キー行列K、バリュー行列Vがそれぞれ(バッチサイズ12、シーケンス長8、埋め込み次元256)の形状を持つとき、スケール化ドット積注意(Scaled Dot-Product Attention)の計算で用いるスケーリング係数は何か?
計算110GPTモデルのファインチューニングにおいて、学習率0.0005、バッチサイズ16、8エポック、トレーニング例数320の場合、合計更新ステップ数はいくつか?
計算111大規模言語モデルのパラメータ効率的なファインチューニング手法LoRAにおいて、元のウェイト行列が4096×4096、LoRA秩rが64の場合、追加されるパラメータ数(バイアスを除く)はいくつか?
計算112トランスフォーマー模型において、マルチヘッド注意機構が8個のヘッドを持ち、全埋め込み次元が512である場合、各ヘッドの埋め込み次元(d_head)はいくつか?
計算113言語モデルの評価指標で、あるテキスト生成タスクにおいて、参照文(reference)の語彙サイズが1200語、生成文(hypothesis)の語彙サイズが980語、2つが共有する語彙数が850語の場合、BLEUスコアの計算における1-gramの精度(precision)はおよそ何%か?
計算114ニューラルネットワークの逆伝播計算において、損失関数から出力層までの勾配が0.15、出力層の重みに関する局所的な勾配が2.4、さらにその前の隠れ層への勾配の鎖則乗算を3回経ると、各段階で勾配が0.8倍される場合、初期層に到達した際の勾配はおよそいくつか?
計算97GPTとBERTの主な違いとして、最も適切なものはどれか。
比較98プロンプトエンジニアリングとファインチューニングの違いとして、正しいのはどれか。
比較99Transformer のEncoder-DecoderアーキテクチャとEncoder-onlyアーキテクチャの違いはどれか。
比較100Zero-shotとFew-shotプロンプティングの最大の違いは何か。
比較101温度パラメータ(Temperature)と上位K抽出(Top-K)サンプリングの役割の違いとして、正しいのはどれか。
比較102LoRA(Low-Rank Adaptation)とQLoRAの主な違いはどれか。
比較91Transformerモデルにおける「注意機構(Attention)」の主な役割として最も適切なものはどれか。
定義92大規模言語モデル(LLM)における「トークン化(Tokenization)」とは何か。最も適切な説明はどれか。
定義93生成AIにおける「プロンプトエンジニアリング」の定義として最も正確なものはどれか。
定義94深層学習における「勾配降下法(Gradient Descent)」の計算式として最も適切なものはどれか。
定義95LLMの学習において「次トークン予測(Next Token Prediction)」とは何か。最も適切な説明はどれか。
定義96LLMにおける「コンテキストウィンドウ(Context Window)」の定義として最も正確なものはどれか。
定義115大規模言語モデル(LLM)の推論時に、温度パラメータ(temperature)を0.1に設定した場合と1.5に設定した場合の出力の特性として正しいものはどれか?
応用116ファインチューニング後のLLMが、訓練データに含まれた特定の意見や属性に対するバイアスを継承していることが発見された場合、このバイアスを軽減するための最も効果的なアプローチはどれか?
応用117LLMをAPI経由でサービス提供する企業が、ユーザーの入力プロンプトをモデルの継続的な改善に使用する際に生じるリスクとして最も重要なものはどれか?
応用118トランスフォーマー構造のLLMにおいて、コンテキスト長を2倍に拡張した場合、計算複雑性と推論速度へはどのような影響が生じるか?
応用119LLMが訓練中に見たことのない新しいドメインのタスクに適用する際、ゼロショット学習よりもフューショット学習が高い性能を示す理由として最も正確なものはどれか?
応用120LLMが「幻覚(hallucination)」を生成する主な原因として最も正確な説明はどれか?
応用AIの社会実装と倫理・法律30問
▼
ある医療AI診断システムの検証データセットで、1,200人の患者のうち960人を正しく診断し、240人を誤診断しました。このシステムの正解率(精度)は何パーセントですか?
計算140あるAI採用システムの評価で、実際に優秀な候補者200人のうち160人が合格判定され、実際には不適切な候補者150人のうち30人が合格判定されました。このシステムの偽陽性率(実際には不適切なのに合格と判定される確率)は何パーセントですか?
計算141ある画像認識AIの性能検証で、特定の肌色グループAに対して95%の認識精度、肌色グループBに対して72%の認識精度でした。この2つのグループ間の精度差は何ポイントですか?また、このような差はAIの何という問題を示唆していますか?
計算142ある信用スコア判定AIの検証で、年間処理件数が5,000件、そのうち不適切な判定が125件ありました。このシステムの誤判定率は何パーセントですか?また、この誤判定率でも許容可能であると判断するには、どの程度の監視・介入体制が必要ですか?
計算143ある大規模言語モデルの訓練に際し、全データセット1,000万件のうち、特定の民族グループAに関するテキストが80万件、グループBに関するテキストが10万件含まれていました。グループAのデータ比率はグループBの何倍ですか?このデータ不均衡はどのような問題を引き起こす可能性がありますか?
計算144ある顔認識システムの年間利用数が300万回で、そのうち誤認識による権利侵害事案が45件発生しました。また同システムの訴訟・賠償費用が1件あたり平均180万円かかります。1年間の賠償総額はいくらですか?また、この社会的コストを考慮すると、システムの利用にはどのような対応が必要ですか?
計算133AIの倫理と規制に関する以下の記述で、誤っているものはどれか。
誤り発見134AI導入における企業責任と法的義務に関する以下の記述で、誤っているものはどれか。
誤り発見135AIとプライバシー保護に関する以下の記述で、誤っているものはどれか。
誤り発見136AIによる自動意思決定と説明責任に関する以下の記述で、誤っているものはどれか。
誤り発見137AI開発における著作権と知的財産権に関する以下の記述で、誤っているものはどれか。
誤り発見138AIのセキュリティと安全性に関する以下の記述で、誤っているものはどれか。
誤り発見121AIアルゴリズムの偏見(バイアス)とは、以下のどの現象を指しますか?
定義122説明可能性(Explainability)とは何を指しますか?
定義123プライバシー保護における「差分プライバシー」とは、以下のどの技術を指しますか?
定義124GDPR(一般データ保護規則)における「被忘れる権利」とは何を指しますか?
定義125AIアルゴリズムの「透明性」と「説明可能性」の違いは何ですか?
定義126AIの「責任あるAI(Responsible AI)」とは、以下のどの概念を最も適切に説明していますか?
定義127「説明可能性(Explainability)」と「透明性(Transparency)」の違いについて、最も適切な説明はどれか。
比較128「アルゴリズムバイアス」と「データバイアス」の主な違いは何か。
比較129GDPR(一般データ保護規則)と個人情報保護法(日本)の主な違いについて、最も正確なものはどれか。
比較130「機械学習の公平性(Fairness)」における「グループ公平性」と「個別公平性」の基本的な違いは何か。
比較131「規制型AI(Regulatory AI)」と「AIを用いた規制(AI-Enabled Regulation)」の違いについて、最も適切な説明はどれか。
比較132AIシステムにおける「説明責任(Accountability)」と「責任(Responsibility)」の違いについて、最も正確なのはどれか。
比較145医療診断AIが学習データの偏りにより特定の人種層に対して診断精度が大幅に低下していることが判明した場合、企業として最初に優先すべき対応は何か?
応用146採用選考にAIが「女性候補者の評価を男性より系統的に低く付けている」という分析結果が報告された。この問題が発生した根本的な理由として最も考えられるのはどれか?
応用147SNS上での感情分析AIが特定の政治的意見を『危険』と分類し、自動的に投稿が削除されるケースが増加している。この事態において、プラットフォーム企業が直面する主要な課題は何か?
応用148生成AIが学習時に著作権で保護された著作物を大量に使用していた場合、企業が法的・倫理的に取り得るべき対応として最も適切なのはどれか?
応用149顔認識AIが駅の監視カメラに導入され、容疑者の追跡に成功したが、同時に市民のプライバシー懸念が急増した。行政機関がこの技術を継続する場合、最優先で実装すべき措置はどれか?
応用150ローン審査AIが経済的に困難な特定の地域の申請者を自動的に不適格としていることが発覚した。このAIの判定結果をそのまま信頼して運用を続けると、企業が直面しうる最大のリスクは何か?
応用