機械学習の基礎応用
画像分類モデルを、元の訓練データ(自社データセット)で学習した後、異なる撮影環境(照度・角度・背景)の新しい顧客データで運用したところ、精度が81%から52%に低下しました。この問題を部分的に緩和する最初の施策として、最も効果的なアプローチはどれですか?
A.新しい環境のデータを少量でも訓練セットに含め、モデルを微調整(ファインチューニング)する← 正解
✓ 正解です。新環境のデータで微調整することで、モデルが新しい撮影環境の特徴を学習でき、ドメイン適応が可能です。少量のデータでも効果があり、計算コストも低いです。
B.自社の元訓練データを削除し、顧客データだけでモデルをゼロから再訓練する
✗ 自社の訓練データを削除してゼロから再訓練すると、既に習得した知識を失い、新データだけでは過学習のリスクが高まります。非効率的です。
C.モデルの複雑度を大幅に増やし、より多くの環境パターンを学習できるようにする
✗ モデルの複雑度を増やすと、環境差に対応できるように見えますが、実際には過学習を招き、本番精度をさらに低下させる可能性があります。
D.予測確率の閾値を0.5から0.8に上げ、低信頼度の予測を除外する
✗ 閾値を上げると低信頼度予測を除外しますが、環境差による根本的な精度低下には対応できず、判定できないデータが増える問題が発生します。
この問題のポイント
新環境のデータで微調整することで、モデルが新しい撮影環境の特徴を学習でき、ドメイン適応が可能です。少量のデータでも効果があり、計算コストも低いです。
「機械学習の基礎」の他の問題
IT・クラウド の関連資格
AWS Certified Cloud Practitioner(CLF-C02)
AWSクラウドの入門資格。クラウドの概念・AWSのコアサービス・セキュリティ・料金モデルを問う。
AWS Certified Solutions Architect - Associate(SAA-C03)
AWSでのシステム設計能力を問うアソシエイト資格。高可用性・セキュリティ・コスト最適化の設計が中心。
DP-900:Microsoft Azure Data Fundamentals
Azureのデータサービスの基礎を問うMicrosoft認定資格。リレーショナル/非リレーショナルデータ、分析ワークロード、コアのデータ概念を扱う。