Similar to 階層型強化学習
強化学習
Reinforcement learningDQN (コンピュータ)
人間のフィードバックによる強化学習
Reinforcement learning from human feedbackQ学習
Q-learningSARSA法
State–action–reward–state–actionエンドツーエンドの強化学習
End-to-end reinforcement learning時間差分学習
Temporal difference learningベイズ強化学習
モデルフリー (強化学習)
Model-free (reinforcement learning)分布ソフト・アクター・クリティック法
Distributional Soft Actor Critic近接方策最適化
Proximal policy optimization人工知能
Artificial intelligence▼-1 trendsTemplate:主な人工知能
Template:Generative AITemplate:人工知能による存亡リスク
Template:Existential risk from artificial intelligenceAI JIMY Converter
AI JIMY Paperbot
AIセーフティ
AI safetyApple Intelligence
Apple IntelligenceCopilotキー
Copilot keyDABUS
DABUSDirectML
DyNet
FIELD system
Galaxy AI
Galaxy AIGoogle AI
Google AIGPTs
ID3
ID3 algorithmJabberwacky
Jabberwacky