Category:強化学習
DQN (コンピュータ)
モデルフリー (強化学習)
Model-free (reinforcement learning)分布ソフト・アクター・クリティック法
Distributional Soft Actor Criticエンドツーエンドの強化学習
End-to-end reinforcement learningSARSA法
State–action–reward–state–actionベイズ強化学習
時間差分学習
Temporal difference learning階層型強化学習
近接方策最適化
Proximal policy optimizationQ学習
Q-learning強化学習
Reinforcement learning人間のフィードバックによる強化学習
Reinforcement learning from human feedback