機械学習の基礎誤り発見

以下の記述で誤っているものはどれか。

A.エンコーディング技法の一種であるワンホットエンコーディングは、カテゴリ変数をバイナリ特徴量に変換する手法である。
✓ この記述は正しい。ワンホットエンコーディングは機械学習の前処理として広く使用される。
B.敵対的検証(Adversarial Validation)とは、訓練データとテストデータの分布の違いを検出し、データリークを防ぐ手法である。
✓ この記述は正しい。訓練とテストの分布ずれ(Data Leakage)を検出する重要な手法である。
C.特徴量の多重共線性(マルチコリニアリティ)とは、複数の特徴量が高い相関を持つ状況を指し、線形回帰モデルの係数推定を不安定にする。
✓ この記述は正しい。多重共線性は統計的推定の信頼性を損なわせ、解釈を難しくする。
D.アンサンブル学習では、基学習器(弱学習器)の精度が高いほど、アンサンブル全体の性能も必ず向上する。← 正解
✓ 正解です。この記述が誤りで、アンサンブル学習の効果は基学習器の多様性が重要である。高精度でも多様性のない学習器を組み合わせても性能向上が限定的である。

G検定(深層学習・ジェネラリスト検定) の問題一覧