問題
強化学習の説明として、最も適切なものはどれか。
選択肢
- 1大量の正解データを繰り返し学習させてモデルの精度を高める手法
- 2学習データを増やすためにデータの水増し(拡張)を行う手法
- 3エージェントが環境と相互作用しながら、報酬を最大化する行動方策を学習する手法
- 4学習済みモデルを別のタスクに転用して再学習させる手法
解答と解説を見る
正解
3. エージェントが環境と相互作用しながら、報酬を最大化する行動方策を学習する手法
解説
強化学習は、エージェント(学習主体)が環境の中で試行錯誤しながら行動し、得られる報酬を最大化するように行動方策を学習する手法です。ゲームAIやロボット制御などに活用されます。