MLの概念応用
訓練データに大量のラベル誤りが混在していることが後から発見された場合、モデルの性能と学習曲線にはどのような影響が生じるか?
A.訓練精度と検証精度が両方とも高いままで、ラベル誤りはモデル性能に影響しない
✗ ラベル誤りはモデルに矛盾したシグナルを与えるため、必ず性能低下につながります。
B.訓練精度は高いが、検証精度が低くなり、検証精度が訓練精度に追いつきにくい状態となる
✗ ラベル誤りのあるデータで訓練すると、訓練精度そのものが低くなる傾向にあります。
C.訓練精度が低いままとなり、検証精度との大きなギャップが生じやすくなる← 正解
✓ 正解です。誤ったラベルによる矛盾した学習シグナルにより、訓練精度が上がりにくくなり、その結果検証精度とのギャップが大きくなります。
D.訓練曲線が安定せず、急激に振動する
✗ ラベル誤りが訓練曲線の振動を直接的に引き起こすわけではありません。
この問題のポイント
誤ったラベルによる矛盾した学習シグナルにより、訓練精度が上がりにくくなり、その結果検証精度とのギャップが大きくなります。
「MLの概念」の他の問題
IT・クラウド の関連資格
AWS Certified Cloud Practitioner(CLF-C02)
AWSクラウドの入門資格。クラウドの概念・AWSのコアサービス・セキュリティ・料金モデルを問う。
AWS Certified Solutions Architect - Associate(SAA-C03)
AWSでのシステム設計能力を問うアソシエイト資格。高可用性・セキュリティ・コスト最適化の設計が中心。
DP-900:Microsoft Azure Data Fundamentals
Azureのデータサービスの基礎を問うMicrosoft認定資格。リレーショナル/非リレーショナルデータ、分析ワークロード、コアのデータ概念を扱う。