深層学習応用
ニューラルネットワークの訓練中、勾配消失問題(Vanishing Gradient Problem)が発生した場合、以下のうちどの現象が最も可能性が高いか?
A.初期層の重みが頻繁に大幅に更新され、モデルが不安定になる
✗ これは勾配爆発(Exploding Gradient)の説明であり、勾配消失とは逆の現象である。
B.ネットワークの深い層における重みの更新が非常に小さくなり、訓練が停滞する← 正解
✓ 正解です。逆伝播により層を遡るたびに勾配が乗算されるため、ReLU以前の活性化関数では勾配がゼロに近づき、深い層の学習が停滞します。
C.出力層の勾配が爆発的に増加し、損失関数の値が無限大に発散する
✗ 勾配消失問題では勾配が小さくなるため、損失が無限大に発散することはない。これは勾配爆発の特徴である。
D.隠れ層のニューロンが過剰に活性化し、メモリ使用量が急増する
✗ 勾配消失問題の主症状はメモリ増加ではなく、深い層の学習が進まないことである。
この問題のポイント
逆伝播により層を遡るたびに勾配が乗算されるため、ReLU以前の活性化関数では勾配がゼロに近づき、深い層の学習が停滞します。
「深層学習」の他の問題
CNN(畳み込みニューラルネットワーク)が画像認識に適している主な理由はどれか?長文テキストや会話履歴など「長距離の依存関係」を効率的に学習するGPTなどの基盤になっているアーキテクチャはどれか?転移学習を用いて、新しい医療画像分類タスク向けに事前学習済みモデルを微調整する際、訓練データが非常に限定的(200枚程度…リカレントニューラルネットワーク(RNN)を用いた時系列予測モデルで、シーケンスの長さが急激に増加した場合、以下のうち最…Attention機構を備えたTransformerモデルにおいて、入力シーケンスの長さが倍になった場合、計算複雑度はど…バッチ正規化(Batch Normalization)を訓練中に適用したが、訓練セットでの精度は高いのにテストセットでの…
IT・クラウド の関連資格
AWS Certified Cloud Practitioner(CLF-C02)
AWSクラウドの入門資格。クラウドの概念・AWSのコアサービス・セキュリティ・料金モデルを問う。
AWS Certified Solutions Architect - Associate(SAA-C03)
AWSでのシステム設計能力を問うアソシエイト資格。高可用性・セキュリティ・コスト最適化の設計が中心。
DP-900:Microsoft Azure Data Fundamentals
Azureのデータサービスの基礎を問うMicrosoft認定資格。リレーショナル/非リレーショナルデータ、分析ワークロード、コアのデータ概念を扱う。