深層学習誤り発見
以下の過学習(オーバーフィッティング)と正則化に関する記述のうち、誤っているものはどれか?
A.L1正則化はモデルの重みの絶対値の合計をペナルティとして加え、スパース解を生成する傾向がある
✓ この記述は正しい。L1正則化は絶対値ペナルティにより、多くの重みを0に近づけるスパース解を生成する。
B.早期停止は訓練誤差と検証誤差が乖離し始めたときに訓練を中断する方法であり、過学習を防ぐ有効な手段である
✓ この記述は正しい。早期停止は検証誤差が増加し始めたときに訓練を終了し、過学習を効果的に防ぐ手段である。
C.データ拡張(データオーグメンテーション)は訓練データを増加させることで、モデルの汎化性能を向上させる
✓ この記述は正しい。データ拡張により訓練サンプルの多様性が増し、モデルの汎化性能が向上する。
D.L2正則化(重み減衰)は重みの二乗を大きくするペナルティを加え、より多くの重みを完全にゼロにする← 正解
✓ 正解です。この記述が誤りです。L2正則化は重みを小さくしますが、完全にゼロにするわけではありません。スパースなゼロ化はL1正則化の特性です。
この問題のポイント
この記述が誤りです。L2正則化は重みを小さくしますが、完全にゼロにするわけではありません。スパースなゼロ化はL1正則化の特性です。
「深層学習」の他の問題
CNN(畳み込みニューラルネットワーク)が画像認識に適している主な理由はどれか?長文テキストや会話履歴など「長距離の依存関係」を効率的に学習するGPTなどの基盤になっているアーキテクチャはどれか?ニューラルネットワークの訓練中、勾配消失問題(Vanishing Gradient Problem)が発生した場合、以下…転移学習を用いて、新しい医療画像分類タスク向けに事前学習済みモデルを微調整する際、訓練データが非常に限定的(200枚程度…リカレントニューラルネットワーク(RNN)を用いた時系列予測モデルで、シーケンスの長さが急激に増加した場合、以下のうち最…Attention機構を備えたTransformerモデルにおいて、入力シーケンスの長さが倍になった場合、計算複雑度はど…
IT・クラウド の関連資格
AWS Certified Cloud Practitioner(CLF-C02)
AWSクラウドの入門資格。クラウドの概念・AWSのコアサービス・セキュリティ・料金モデルを問う。
AWS Certified Solutions Architect - Associate(SAA-C03)
AWSでのシステム設計能力を問うアソシエイト資格。高可用性・セキュリティ・コスト最適化の設計が中心。
DP-900:Microsoft Azure Data Fundamentals
Azureのデータサービスの基礎を問うMicrosoft認定資格。リレーショナル/非リレーショナルデータ、分析ワークロード、コアのデータ概念を扱う。