機械学習の基礎誤り発見

以下の記述で誤っているものはどれか。

A.機械学習パイプラインにおいて、特徴量エンジニアリングは、ドメイン知識と統計的手法を組み合わせて新たな特徴量を生成するプロセスである。
✓ この記述は正しい。特徴量エンジニアリングはモデル精度向上の重要なステップである。
B.ROC曲線はTPR(真陽性率)対FPR(偽陽性率)の関係を図示し、異なる分類閾値でのモデル性能を視覚的に比較するのに用いられる。
✓ この記述は正しい。ROC曲線はAUC(面積)で総合的な性能を評価できる利点がある。
C.アンダーサンプリングとオーバーサンプリングは、クラス不均衡データの処理方法であり、アンダーサンプリングは多数クラスの一部を削除する。
✓ この記述は正しい。アンダーサンプリングは多数クラス削減、オーバーサンプリングは少数クラス増加で対応する。
D.ベイズ最適化は、探索と評価が並列に実行されるため、グリッドサーチやランダムサーチよりも常に高速である。← 正解
✓ 正解です。この記述が誤りで、ベイズ最適化は逐次的に候補点を評価するため、初期段階では並列化されない。ただし、学習曲線の効率性では他の手法より優れている。

G検定(深層学習・ジェネラリスト検定) の問題一覧