深層学習応用
リカレントニューラルネットワーク(RNN)を用いた時系列予測モデルで、シーケンスの長さが急激に増加した場合、以下のうち最初に顕著になる問題はどれか?
A.出力層の活性化関数が飽和し、予測精度が急低下する
✗ 活性化関数の飽和は勾配消失の一部の原因だが、シーケンス長増加の直接的な主要問題ではない。
B.逆伝播時に勾配が指数関数的に減衰し、遠い過去の情報が学習されなくなる← 正解
✓ 正解です。RNNでは長いシーケンスにおいて逆伝播で繰り返し乗算が起こり、勾配が指数的に減衰する(勾配消失)ため、初期時刻の情報が失われます。
C.訓練データのバッチサイズが自動的に縮小され、勾配推定の分散が増加する
✗ バッチサイズは自動調整されず、シーケンス長とは独立した訓練パラメータである。
D.入力層のノード数が制限され、系列全体を処理できなくなる
✗ 入力層のノード数はシーケンス長に応じて変わらず、RNNは可変長シーケンスを処理可能に設計されている。
この問題のポイント
RNNでは長いシーケンスにおいて逆伝播で繰り返し乗算が起こり、勾配が指数的に減衰する(勾配消失)ため、初期時刻の情報が失われます。
「深層学習」の他の問題
CNN(畳み込みニューラルネットワーク)が画像認識に適している主な理由はどれか?長文テキストや会話履歴など「長距離の依存関係」を効率的に学習するGPTなどの基盤になっているアーキテクチャはどれか?ニューラルネットワークの訓練中、勾配消失問題(Vanishing Gradient Problem)が発生した場合、以下…転移学習を用いて、新しい医療画像分類タスク向けに事前学習済みモデルを微調整する際、訓練データが非常に限定的(200枚程度…Attention機構を備えたTransformerモデルにおいて、入力シーケンスの長さが倍になった場合、計算複雑度はど…バッチ正規化(Batch Normalization)を訓練中に適用したが、訓練セットでの精度は高いのにテストセットでの…
IT・クラウド の関連資格
AWS Certified Cloud Practitioner(CLF-C02)
AWSクラウドの入門資格。クラウドの概念・AWSのコアサービス・セキュリティ・料金モデルを問う。
AWS Certified Solutions Architect - Associate(SAA-C03)
AWSでのシステム設計能力を問うアソシエイト資格。高可用性・セキュリティ・コスト最適化の設計が中心。
DP-900:Microsoft Azure Data Fundamentals
Azureのデータサービスの基礎を問うMicrosoft認定資格。リレーショナル/非リレーショナルデータ、分析ワークロード、コアのデータ概念を扱う。