機械学習の基礎誤り発見
機械学習モデルのロバスト性と信頼性に関する以下の記述で、誤っているものはどれか。
A.クラスバランスの取れていないデータセット(例:陽性が1%、陰性が99%)では、単純な精度だけでモデル評価すると不適切な結論に至る可能性がある。
✓ この記述は正しい。クラスバランスが取れていない場合は、適合率や再現率、F値など複数指標で評価することが重要である。
B.アウトライア(外れ値)の存在は線形回帰モデルに大きな悪影響を与えるため、事前に検出・除去または変換することが推奨される。
✓ この記述は正しい。外れ値は最小二乗法に基づく線形回帰に大きく影響するため、前処理段階での除去や変換が効果的である。
C.モデルの予測結果が人間の判断と異なる場合、常にモデルの方が正確であるため、モデルの判定を優先するべきである。← 正解
✓ 正解です。この記述が誤りで、モデルの予測が常に正確とは限らず、特にデータ品質の問題や学習不足が原因でバイアスを持つことがある。重要な判断では人間の専門知識とモデルの結果を統合的に検討すべきである。
D.複数のモデルを組み合わせるアンサンブル学習は、個別モデルより汎化性能が高まる可能性があり、Bagging や Boosting が一般的な手法である。
✓ この記述は正しい。アンサンブル学習は多様なモデルを組み合わせることで予測精度を向上させ、実務で広く採用されている。
この問題のポイント
この記述が誤りで、モデルの予測が常に正確とは限らず、特にデータ品質の問題や学習不足が原因でバイアスを持つことがある。重要な判断では人間の専門知識とモデルの結果を統合的に検討すべきである。
「機械学習の基礎」の他の問題
IT・クラウド の関連資格
AWS Certified Cloud Practitioner(CLF-C02)
AWSクラウドの入門資格。クラウドの概念・AWSのコアサービス・セキュリティ・料金モデルを問う。
AWS Certified Solutions Architect - Associate(SAA-C03)
AWSでのシステム設計能力を問うアソシエイト資格。高可用性・セキュリティ・コスト最適化の設計が中心。
DP-900:Microsoft Azure Data Fundamentals
Azureのデータサービスの基礎を問うMicrosoft認定資格。リレーショナル/非リレーショナルデータ、分析ワークロード、コアのデータ概念を扱う。