AIソリューションの実装とユースケース応用問題
Amazon SageMakerでトレーニングしたモデルのF1スコアが本番環境で徐々に低下していることが確認されました。トレーニング時のデータ分布と本番データの分布が乖離してきている場合、この現象を何と呼び、どのような対処が適切ですか?
A.過学習(Overfitting)と呼ばれ、モデルの複雑度を下げるために正則化を追加する必要がある
✗ 過学習はトレーニングデータへの過適合であり、本番データ分布の変化による性能低下とは異なります。
B.モデルドリフト(Model Drift)と呼ばれ、最新データでモデルを再トレーニングすることが適切である← 正解
✓ 正解です。データ分布の変化によるモデル性能低下はモデルドリフトと呼ばれ、再トレーニングが有効です。
C.アンダーフィッティング(Underfitting)と呼ばれ、より多くの特徴量をモデルに追加する必要がある
✗ アンダーフィッティングはモデルが学習不足な状態であり、本番環境での経時的な性能低下とは別の概念です。
D.ハイパーパラメータの劣化と呼ばれ、学習率を下げて再度トレーニングする必要がある
✗ ハイパーパラメータ劣化という概念は存在せず、データ分布変化への対処としても適切ではありません。