深層学習応用
LSTM(長短期記憶)ネットワークにおいて、忘却ゲート(Forget Gate)の重みが訓練を通じてゼロに近づいてしまう場合、このモデルの振る舞いとして最も適切な説明はどれか?
A.セル状態の情報が蓄積され続け、長期記憶が過度に強化される
✗ 忘却ゲートがゼロに近づくと過去情報を保持できなくなるため、情報の蓄積は生じない。むしろ逆である。
B.セル状態から過去の情報がほぼ全て削除され、直近の入力情報のみを処理するようになる← 正解
✓ 正解です。忘却ゲートがゼロに近づくと、セル状態が乗算される値が約0になり、過去のセル状態がリセットされるため、直近入力の影響のみが強くなります。
C.入力ゲートと出力ゲートが自動調整され、モデルが自己補正する
✗ 他のゲートが自動補正される仕組みはLSTMにはなく、各ゲートは独立して最適化される。
D.勾配消失問題が再発し、訓練が完全に停滞する
✗ LSTMは設計上、忘却ゲートの問題があっても勾配消失を完全には避けられないが、訓練が即座に停滞するわけではない。
この問題のポイント
忘却ゲートがゼロに近づくと、セル状態が乗算される値が約0になり、過去のセル状態がリセットされるため、直近入力の影響のみが強くなります。
「深層学習」の他の問題
CNN(畳み込みニューラルネットワーク)が画像認識に適している主な理由はどれか?長文テキストや会話履歴など「長距離の依存関係」を効率的に学習するGPTなどの基盤になっているアーキテクチャはどれか?ニューラルネットワークの訓練中、勾配消失問題(Vanishing Gradient Problem)が発生した場合、以下…転移学習を用いて、新しい医療画像分類タスク向けに事前学習済みモデルを微調整する際、訓練データが非常に限定的(200枚程度…リカレントニューラルネットワーク(RNN)を用いた時系列予測モデルで、シーケンスの長さが急激に増加した場合、以下のうち最…Attention機構を備えたTransformerモデルにおいて、入力シーケンスの長さが倍になった場合、計算複雑度はど…
IT・クラウド の関連資格
AWS Certified Cloud Practitioner(CLF-C02)
AWSクラウドの入門資格。クラウドの概念・AWSのコアサービス・セキュリティ・料金モデルを問う。
AWS Certified Solutions Architect - Associate(SAA-C03)
AWSでのシステム設計能力を問うアソシエイト資格。高可用性・セキュリティ・コスト最適化の設計が中心。
DP-900:Microsoft Azure Data Fundamentals
Azureのデータサービスの基礎を問うMicrosoft認定資格。リレーショナル/非リレーショナルデータ、分析ワークロード、コアのデータ概念を扱う。