模擬試験応用

ある医療関連スタートアップが、患者の症状から疾患を判別する機械学習モデルを開発しました。データセットを確認したところ、特定の性別・年齢層で訓練サンプルが極端に少ないことが判明しました。このバイアス問題を解決するために最初に実施すべき対応はどれか?

A.不足している層のサンプルを追加収集し、訓練データの代表性を確保する← 正解
✓ 正解です。医療診断では全ユーザーに対する公正性が必須で、訓練時に代表性を確保することが最優先です。バイアス軽減の根本解決になります。
B.精度の低い層に対しては別モデルを構築するなど、セグメント化した運用を計画する
✗ セグメント化は補完的な対応ですが、根本的なデータ品質問題を先送りにしています。
C.本番運用開始後に精度を継続的にモニタリングし、問題が顕在化してから対応する
✗ 本番運用後の発見は医療提供の安全性と倫理に悖る対応です。
D.機械学習アルゴリズムを変更して、不完全なデータに対して頑健なモデルに置き換える
✗ アルゴリズム変更だけではバイアス源となっているデータの問題は解決されません。

この問題のポイント

医療診断では全ユーザーに対する公正性が必須で、訓練時に代表性を確保することが最優先です。バイアス軽減の根本解決になります。

AI-900:Microsoft Azure AI Fundamentals の問題一覧