画像分類タスクで訓練データセットが著しく不均衡（あるクラスが極端に少ない）な場合、モデルの… | G検定（深層学習・ジェネラリスト検定）

深層学習（ディープラーニング）応用

画像分類タスクで訓練データセットが著しく不均衡（あるクラスが極端に少ない）な場合、モデルの性能を改善するために講じるべき対策として最も適切なのはどれか？

A.少数クラスのデータを複数回使い回し、または過剰サンプリング・データ拡張により訓練データのバランスを改善する← 正解

✓ 正解です。過剰サンプリング、アンダーサンプリング、データ拡張により訓練データのバランスを改善し、モデルが少数クラスを見落とさないようにします。

B.少数クラスを完全に削除し、多数クラスのみで訓練する

✗ 少数クラスを削除すると、そのクラスの予測は不可能になり、問題を解決せず悪化させます。

C.全クラスに均等な重みをランダムに付与する

✗ クラスの重みを単にランダムに付与することは、不均衡の系統的な対処にはなりません。

D.訓練時の学習率を極端に低くする

✗ 学習率を低くすること自体は不均衡問題を解決せず、むしろ収束を遅延させます。

この問題のポイント

過剰サンプリング、アンダーサンプリング、データ拡張により訓練データのバランスを改善し、モデルが少数クラスを見落とさないようにします。

「深層学習（ディープラーニング）」の他の問題

AWS Certified AI Practitioner（AIF-C01）

AWSにおけるAI・ML・生成AIサービスの基礎知識を問う新資格。AIの概念からAWSのAIサービスまで幅広く出題。