AIの基礎定義問題

工場ラインのロボットアームが試行錯誤しながら最適な動作を学習する手法はどれか?

A.教師あり学習
✗ ラベル付きデータが必要な学習方法。試行錯誤ではない。
B.転移学習
✗ 既存モデルを別タスクに適用する手法であり、試行錯誤の枠組みではない。
C.強化学習← 正解
✓ 正解。報酬信号をもとにエージェントが最適な行動方策を自分で学習する。
D.半教師あり学習
✗ 少量のラベル付きデータと多量のラベルなしデータを組み合わせる手法。

AI-900:Microsoft Azure AI Fundamentals の問題一覧