Similar to モデルフリー_(強化学習)
強化学習
Reinforcement learningQ学習
Q-learningSARSA法
State–action–reward–state–actionエンドツーエンドの強化学習
End-to-end reinforcement learning時間差分学習
Temporal difference learningDQN (コンピュータ)
人間のフィードバックによる強化学習
Reinforcement learning from human feedbackモデルフリー (強化学習)
Model-free (reinforcement learning)分布ソフト・アクター・クリティック法
Distributional Soft Actor Critic近接方策最適化
Proximal policy optimization