機械学習の基礎応用

分類モデルの本番運用中、初期学習後に新しいデータが継続的に流入しています。1年後、モデルの予測精度が当初の95%から73%に低下しました。訓練データの再構成以外で、この問題に対応する最初のアプローチはどれですか?

A.モデルのハイパーパラメータを全て初期化し、ゼロから再学習する
✗ ハイパーパラメータの初期化とゼロからの再学習は、コンセプトドリフトの原因が何かを理解する前の施策では、同じ問題を繰り返す可能性が高いです。
B.本番データの最新1ヶ月分を確認し、訓練時からのデータ分布の変化(ドリフト)を調査する← 正解
✓ 正解です。精度低下の原因を診断することが重要です。データドリフトが原因なら、新データでの微調整や訓練データの更新が必要になります。原因把握が最初のステップです。
C.モデルの複雑度を大幅に増やし、より高度な特徴抽出を行う
✗ モデルの複雑度を増やすと過学習が悪化し、精度低下問題はさらに深刻化する可能性があります。根本原因の調査が先決です。
D.予測信頼度スコアの閾値を調整し、低信頼度の予測を除外する
✗ 閾値調整は既存モデルの出力を調整するだけで、精度低下の根本原因(データドリフト)には対応できません。一時的な回避策に過ぎません。

この問題のポイント

精度低下の原因を診断することが重要です。データドリフトが原因なら、新データでの微調整や訓練データの更新が必要になります。原因把握が最初のステップです。

AI-900:Microsoft Azure AI Fundamentals の問題一覧