模擬試験応用
ある医療関連スタートアップが、患者の症状から疾患を判別する機械学習モデルを開発しました。データセットを確認したところ、特定の性別・年齢層で訓練サンプルが極端に少ないことが判明しました。このバイアス問題を解決するために最初に実施すべき対応はどれか?
A.不足している層のサンプルを追加収集し、訓練データの代表性を確保する← 正解
✓ 正解です。医療診断では全ユーザーに対する公正性が必須で、訓練時に代表性を確保することが最優先です。バイアス軽減の根本解決になります。
B.精度の低い層に対しては別モデルを構築するなど、セグメント化した運用を計画する
✗ セグメント化は補完的な対応ですが、根本的なデータ品質問題を先送りにしています。
C.本番運用開始後に精度を継続的にモニタリングし、問題が顕在化してから対応する
✗ 本番運用後の発見は医療提供の安全性と倫理に悖る対応です。
D.機械学習アルゴリズムを変更して、不完全なデータに対して頑健なモデルに置き換える
✗ アルゴリズム変更だけではバイアス源となっているデータの問題は解決されません。
この問題のポイント
医療診断では全ユーザーに対する公正性が必須で、訓練時に代表性を確保することが最優先です。バイアス軽減の根本解決になります。
「模擬試験」の他の問題
ある保険会社が「過去の請求データから詐欺請求かどうかを予測するモデル」を構築したい。最適なMLタスクはどれか?電力会社が「スマートメーターのデータから需要急増の1時間前に警告を出したい」に最適なアプローチはどれか?小売業者が「商品説明テキストを50言語に翻訳してECサイトに表示したい」に最適なAzureサービスはどれか?病院が「X線画像のPDFレポートから患者名・検査日・所見のテキストを構造化して抽出したい」に最適なAzureサービスはど…航空会社が「問い合わせの音声通話を自動でテキスト化し、感情スコアと要約を付けてCRMに記録するシステム」を構築したい。必…「会社のSlackに投稿されたメッセージから、メンション・日時・プロジェクト名を自動で抽出して課題管理ツールに連携したい…
IT・クラウド の関連資格
AWS Certified Cloud Practitioner(CLF-C02)
AWSクラウドの入門資格。クラウドの概念・AWSのコアサービス・セキュリティ・料金モデルを問う。
AWS Certified Solutions Architect - Associate(SAA-C03)
AWSでのシステム設計能力を問うアソシエイト資格。高可用性・セキュリティ・コスト最適化の設計が中心。
DP-900:Microsoft Azure Data Fundamentals
Azureのデータサービスの基礎を問うMicrosoft認定資格。リレーショナル/非リレーショナルデータ、分析ワークロード、コアのデータ概念を扱う。