深層学習応用
転移学習を用いて、新しい医療画像分類タスク向けに事前学習済みモデルを微調整する際、訓練データが非常に限定的(200枚程度)である場合、過学習を最小限に抑えるための最も効果的なアプローチはどれか?
A.モデルの全層を凍結し、新しいクラスに対応する出力層のみを訓練する← 正解
✓ 正解です。事前学習済みモデルの特徴抽出層を凍結し、出力層のみを微調整することで、限定的なデータでも過学習を防ぎながら新タスクに適応できます。
B.学習率を非常に高く設定し、迅速に収束させる
✗ 高い学習率は不安定な訓練と発散を引き起こす可能性が高く、転移学習では低い学習率が推奨される。
C.訓練データ全体でエポック数を1000以上に設定して十分に学習させる
✗ 限定的なデータで多くのエポックを設定すると、過学習がむしろ悪化する。早期停止が有効である。
D.初期化重みを破棄し、新しいランダムな重みから完全に再訓練する
✗ 事前学習済みの有用な特徴を破棄するため、転移学習の利点が完全に失われる。
この問題のポイント
事前学習済みモデルの特徴抽出層を凍結し、出力層のみを微調整することで、限定的なデータでも過学習を防ぎながら新タスクに適応できます。
「深層学習」の他の問題
CNN(畳み込みニューラルネットワーク)が画像認識に適している主な理由はどれか?長文テキストや会話履歴など「長距離の依存関係」を効率的に学習するGPTなどの基盤になっているアーキテクチャはどれか?ニューラルネットワークの訓練中、勾配消失問題(Vanishing Gradient Problem)が発生した場合、以下…リカレントニューラルネットワーク(RNN)を用いた時系列予測モデルで、シーケンスの長さが急激に増加した場合、以下のうち最…Attention機構を備えたTransformerモデルにおいて、入力シーケンスの長さが倍になった場合、計算複雑度はど…バッチ正規化(Batch Normalization)を訓練中に適用したが、訓練セットでの精度は高いのにテストセットでの…
IT・クラウド の関連資格
AWS Certified Cloud Practitioner(CLF-C02)
AWSクラウドの入門資格。クラウドの概念・AWSのコアサービス・セキュリティ・料金モデルを問う。
AWS Certified Solutions Architect - Associate(SAA-C03)
AWSでのシステム設計能力を問うアソシエイト資格。高可用性・セキュリティ・コスト最適化の設計が中心。
DP-900:Microsoft Azure Data Fundamentals
Azureのデータサービスの基礎を問うMicrosoft認定資格。リレーショナル/非リレーショナルデータ、分析ワークロード、コアのデータ概念を扱う。