MLの概念誤り発見
機械学習の性能課題と対応策に関する以下の記述で、誤っているものはどれか。
A.正則化(Regularization)はモデルの複雑さにペナルティを与えることで過学習を抑制し、汎化性能を向上させる手法である。← 正解
✓ 正解です。この記述が誤りで、正則化はモデルの複雑さにペナルティを与えて過学習を抑制する手法であるが、これは高バイアス(過小学習)の改善には逆効果となる。高バイアスにはモデルの複雑化やデータ増加が有効であり、正則化を強化すると過小学習がさらに悪化する。
B.高い分散と低いバイアスは過学習を示す状態であり、正則化やドロップアウトで改善することが多い。
✓ この記述は正しい。高分散は過学習で、正則化やドロップアウトで改善が期待できる。
C.学習曲線を分析すれば、データ量増加で改善するかモデル複雑度が不足しているかを判定できる。
✓ この記述は正しい。学習曲線はモデルの診断に極めて有用なツールである。
D.クラス不均衡データセットではaccuracyが高くても実際の性能が低い場合があり、weighted lossやサンプリング戦略が有効である。
✓ この記述は正しい。不均衡データセットではメトリクスと対策の工夫が重要である。
この問題のポイント
この記述が誤りで、正則化はモデルの複雑さにペナルティを与えて過学習を抑制する手法であるが、これは高バイアス(過小学習)の改善には逆効果となる。高バイアスにはモデルの複雑化やデータ増加が有効であり、正則化を強化すると過小学習がさらに悪化する。
「MLの概念」の他の問題
IT・クラウド の関連資格
AWS Certified Cloud Practitioner(CLF-C02)
AWSクラウドの入門資格。クラウドの概念・AWSのコアサービス・セキュリティ・料金モデルを問う。
AWS Certified Solutions Architect - Associate(SAA-C03)
AWSでのシステム設計能力を問うアソシエイト資格。高可用性・セキュリティ・コスト最適化の設計が中心。
DP-900:Microsoft Azure Data Fundamentals
Azureのデータサービスの基礎を問うMicrosoft認定資格。リレーショナル/非リレーショナルデータ、分析ワークロード、コアのデータ概念を扱う。