機械学習の基礎誤り発見
以下の記述で誤っているものはどれか。
A.決定木は、特徴量の値に基づいてデータを再帰的に分割し、各葉ノードがクラスラベルまたは回帰値を出力する。
✓ この記述は正しい。決定木は分類・回帰いずれにも対応できる解釈可能な機械学習手法である。
B.サポートベクターマシン(SVM)は、訓練データに対して完全に100%の精度を達成することが常に最適なモデルであると言える。← 正解
✓ 正解です。この記述が誤りで、訓練データで100%の精度は過学習の兆候であり、テストデータでの性能低下につながる。最適なモデルは汎化性能が高いものである。
C.k近傍法(k-NN)は、テストサンプルに最も近いk個の訓練サンプルのクラスに基づいて予測を行う非パラメトリック手法である。
✓ この記述は正しい。k-NNは距離ベースの単純で直感的な手法で、パラメータ学習を必要としない。
D.ランダムフォレストは、複数の決定木を並列に構築し、それらの予測を集約することでモデルの性能を向上させるアンサンブル学習法である。
✓ この記述は正しい。ランダムフォレストはバイアス低減とバリアンス削減の両面で効果がある。