Available on
JapaneseClass.jp
Login
Forgot password
MAIN
Social Feeds
LEARN
Practice
Lessons
Readings
Notes
COMMUNITY
Rankings
Forum
Discord
MISCELLANEOUS
Topics
Matome
Dictionary
Donate
Category:強化学習
Q学習
Q-learning
強化学習
Reinforcement learning
SARSA法
State–action–reward–state–action
時間差分学習
Temporal difference learning
DQN (コンピュータ)
近接方策最適化
Proximal policy optimization
エンドツーエンドの強化学習
End-to-end reinforcement learning
人間のフィードバックによる強化学習
Reinforcement learning from human feedback
Categories
日本のアニメ映画
日本の文化
日本の祭り
日本の世界遺産
日本のアイドル
Share
Twitter