問題
AIにおける強化学習の説明として、最も適切なものはどれか。
選択肢
- 1ラベル付きデータから入力と出力の対応を学習する
- 2ラベルのないデータから構造やクラスタを発見する
- 3エージェントが環境との相互作用で報酬を最大化する行動方針を学ぶ
- 4次元削減によりデータを圧縮する
正解
3. エージェントが環境との相互作用で報酬を最大化する行動方針を学ぶ
詳しい解説を見る解説を閉じる
解説
強化学習は環境からのフィードバック(報酬)を最大化するように行動を選択する方策(policy)を学習する手法で、Q学習やSARSAなどが代表例。1は教師あり学習、2は教師なし学習、4も教師なし学習の手法。
一問一答
全400問を繰り返し学習