機械学習の基礎応用

画像分類モデルを、元の訓練データ(自社データセット)で学習した後、異なる撮影環境(照度・角度・背景)の新しい顧客データで運用したところ、精度が81%から52%に低下しました。この問題を部分的に緩和する最初の施策として、最も効果的なアプローチはどれですか?

A.新しい環境のデータを少量でも訓練セットに含め、モデルを微調整(ファインチューニング)する← 正解
✓ 正解です。新環境のデータで微調整することで、モデルが新しい撮影環境の特徴を学習でき、ドメイン適応が可能です。少量のデータでも効果があり、計算コストも低いです。
B.自社の元訓練データを削除し、顧客データだけでモデルをゼロから再訓練する
✗ 自社の訓練データを削除してゼロから再訓練すると、既に習得した知識を失い、新データだけでは過学習のリスクが高まります。非効率的です。
C.モデルの複雑度を大幅に増やし、より多くの環境パターンを学習できるようにする
✗ モデルの複雑度を増やすと、環境差に対応できるように見えますが、実際には過学習を招き、本番精度をさらに低下させる可能性があります。
D.予測確率の閾値を0.5から0.8に上げ、低信頼度の予測を除外する
✗ 閾値を上げると低信頼度予測を除外しますが、環境差による根本的な精度低下には対応できず、判定できないデータが増える問題が発生します。

この問題のポイント

新環境のデータで微調整することで、モデルが新しい撮影環境の特徴を学習でき、ドメイン適応が可能です。少量のデータでも効果があり、計算コストも低いです。

AI-900:Microsoft Azure AI Fundamentals の問題一覧