MLの概念応用

訓練データに大量のラベル誤りが混在していることが後から発見された場合、モデルの性能と学習曲線にはどのような影響が生じるか?

A.訓練精度と検証精度が両方とも高いままで、ラベル誤りはモデル性能に影響しない
✗ ラベル誤りはモデルに矛盾したシグナルを与えるため、必ず性能低下につながります。
B.訓練精度は高いが、検証精度が低くなり、検証精度が訓練精度に追いつきにくい状態となる
✗ ラベル誤りのあるデータで訓練すると、訓練精度そのものが低くなる傾向にあります。
C.訓練精度が低いままとなり、検証精度との大きなギャップが生じやすくなる← 正解
✓ 正解です。誤ったラベルによる矛盾した学習シグナルにより、訓練精度が上がりにくくなり、その結果検証精度とのギャップが大きくなります。
D.訓練曲線が安定せず、急激に振動する
✗ ラベル誤りが訓練曲線の振動を直接的に引き起こすわけではありません。

この問題のポイント

誤ったラベルによる矛盾した学習シグナルにより、訓練精度が上がりにくくなり、その結果検証精度とのギャップが大きくなります。

AI-900:Microsoft Azure AI Fundamentals の問題一覧