Azure ML発展応用
Azure MLの自動機械学習(AutoML)で、分類問題のデータセットに極端なクラス不均衡がある場合、モデル評価メトリクスとして最も信頼性が高いものはどれか?
A.精度(Accuracy)をそのまま使用する
✗ 極端なクラス不均衡では、精度は多数派クラスを予測するだけで高くなる可能性があり、少数派クラスの検出性能を見落とします。
B.AUC-ROC曲線を評価指標とする← 正解
✓ 正解です。AUC-ROC曲線はクラス不均衡の影響を受けにくく、閾値変更時の真陽性率と偽陽性率のトレードオフを適切に評価します。不均衡データセットの評価に最適です。
C.クラス比率を無視して適合率のみ参照する
✗ 適合率のみでは、モデルがどの程度少数派クラスを見逃しているか(再現率)が不明となり、不完全な評価になります。
D.多数派クラスの再現率のみを監視する
✗ 多数派クラスの再現率だけでは、実務で重要となる少数派クラスの検出能力を評価できません。
この問題のポイント
AUC-ROC曲線はクラス不均衡の影響を受けにくく、閾値変更時の真陽性率と偽陽性率のトレードオフを適切に評価します。不均衡データセットの評価に最適です。
「Azure ML発展」の他の問題
Azure MLのMLflowの「実験(Experiment)」と「実行(Run)」の関係はどれか?Azure MLパイプラインを使う主な利点として正しくないものはどれか?Azure MLにおける「自動機械学習(AutoML)」と「設計者(Designer)」の違いとして最も適切なものはどれ…Azure MLの「コンピュート・インスタンス」と「コンピュート・クラスタ」の使用目的の違いはどれか?Azure MLの「パイプライン」と「Automated Machine Learning(AutoML)」を比較した場…Azure MLにおける「バッチ推論」と「リアルタイム推論(オンライン推論)」の違いとして最適なものはどれか?
IT・クラウド の関連資格
AWS Certified Cloud Practitioner(CLF-C02)
AWSクラウドの入門資格。クラウドの概念・AWSのコアサービス・セキュリティ・料金モデルを問う。
AWS Certified Solutions Architect - Associate(SAA-C03)
AWSでのシステム設計能力を問うアソシエイト資格。高可用性・セキュリティ・コスト最適化の設計が中心。
DP-900:Microsoft Azure Data Fundamentals
Azureのデータサービスの基礎を問うMicrosoft認定資格。リレーショナル/非リレーショナルデータ、分析ワークロード、コアのデータ概念を扱う。