画像分類モデルを、元の訓練データ（自社データセット）で学習した後、異なる撮影環境（照度・角… | AI-900：Microsoft Azure AI Fundamentals

機械学習の基礎応用

画像分類モデルを、元の訓練データ（自社データセット）で学習した後、異なる撮影環境（照度・角度・背景）の新しい顧客データで運用したところ、精度が81%から52%に低下しました。この問題を部分的に緩和する最初の施策として、最も効果的なアプローチはどれですか？

A.新しい環境のデータを少量でも訓練セットに含め、モデルを微調整（ファインチューニング）する← 正解

✓ 正解です。新環境のデータで微調整することで、モデルが新しい撮影環境の特徴を学習でき、ドメイン適応が可能です。少量のデータでも効果があり、計算コストも低いです。

B.自社の元訓練データを削除し、顧客データだけでモデルをゼロから再訓練する

✗ 自社の訓練データを削除してゼロから再訓練すると、既に習得した知識を失い、新データだけでは過学習のリスクが高まります。非効率的です。

C.モデルの複雑度を大幅に増やし、より多くの環境パターンを学習できるようにする

✗ モデルの複雑度を増やすと、環境差に対応できるように見えますが、実際には過学習を招き、本番精度をさらに低下させる可能性があります。

D.予測確率の閾値を0.5から0.8に上げ、低信頼度の予測を除外する

✗ 閾値を上げると低信頼度予測を除外しますが、環境差による根本的な精度低下には対応できず、判定できないデータが増える問題が発生します。

この問題のポイント

新環境のデータで微調整することで、モデルが新しい撮影環境の特徴を学習でき、ドメイン適応が可能です。少量のデータでも効果があり、計算コストも低いです。

「機械学習の基礎」の他の問題

AWS Certified Cloud Practitioner（CLF-C02）

AWSクラウドの入門資格。クラウドの概念・AWSのコアサービス・セキュリティ・料金モデルを問う。

AWS Certified Solutions Architect - Associate（SAA-C03）

AWSでのシステム設計能力を問うアソシエイト資格。高可用性・セキュリティ・コスト最適化の設計が中心。

DP-900：Microsoft Azure Data Fundamentals

Azureのデータサービスの基礎を問うMicrosoft認定資格。リレーショナル/非リレーショナルデータ、分析ワークロード、コアのデータ概念を扱う。