Similar to 人間のフィードバックによる強化学習
特徴量
Feature (machine learning)なめらかな社会とその敵
日本語処理
Japanese language and computers日本ディープラーニング協会
ビタビアルゴリズム
Viterbi algorithm部分観測マルコフ決定過程
Partially observable Markov decision processフローベース生成モデル
Flow-based generative model文書分類
Document classification分類 (統計学)
Statistical classificationサミー・ベンジオ
Samy Bengio放射基底関数
Radial basis functionマージン分類器
Margin classifierマルコフ確率場
Markov random fieldMulti-Step Super-Resolution
メタ学習
Meta learning (computer science)ランダムフォレスト
Random forestLoRA
ロボティック・プロセス・オートメーション
Robotic process automation▲1 trends特徴抽出
Feature engineeringQ学習
Q-learningSARSA法
State–action–reward–state–actionエンドツーエンドの強化学習
End-to-end reinforcement learning時間差分学習
Temporal difference learningモデルフリー (強化学習)
Model-free (reinforcement learning)分布ソフト・アクター・クリティック法
Distributional Soft Actor Critic近接方策最適化
Proximal policy optimization人工知能
Artificial intelligence▼-1 trendsApple Intelligence
Apple Intelligence