問題
強化学習の説明として、最も適切なものはどれか。
選択肢
- 1大量の正解データを繰り返し学習させてモデルの精度を高める手法
- 2学習データを増やすためにデータの水増し(拡張)を行う手法
- 3エージェントが環境と相互作用しながら、報酬を最大化する行動方策を学習する手法
- 4学習済みモデルを別のタスクに転用して再学習させる手法
正解
3. エージェントが環境と相互作用しながら、報酬を最大化する行動方策を学習する手法
詳しい解説を見る解説を閉じる
解説
強化学習は、エージェント(学習主体)が環境と相互作用しながら試行錯誤で行動し、行動の結果として得られる報酬を最大化するような行動方策を学習する手法である。正解データを与えるのではなく「報酬」という評価信号で学習が進む点が特徴で、囲碁AIやロボット制御、ゲーム攻略などに活用される。誤答肢のうち、大量の正解データを繰り返し学習させるのは教師あり学習、データの水増し(データ拡張)は学習データを人工的に増やす前処理技術、学習済みモデルを別タスクに転用するのは転移学習の説明であり、いずれも報酬に基づく試行錯誤という強化学習の本質と異なる。試験では「エージェント」「環境」「報酬の最大化」という3つのキーワードが出たら強化学習と判断してよい。
一問一答
全200問を繰り返し学習