Similar to 人間のフィードバックによる強化学習
特徴選択
Feature selection特徴量
Feature (machine learning)なめらかな社会とその敵
日本語処理
Japanese language and computers日本ディープラーニング協会
ビタビアルゴリズム
Viterbi algorithm部分観測マルコフ決定過程
Partially observable Markov decision processフローベース生成モデル
Flow-based generative model文書分類
Document classification分類 (統計学)
Statistical classificationサミー・ベンジオ
Samy Bengio放射基底関数
Radial basis functionマージン分類器
Margin classifierマルコフ確率場
Markov random fieldMulti-Step Super-Resolution
メタ学習
Meta learning (computer science)ランダムフーリエ特徴量
ランダムフォレスト
Random forestLoRA
LoRAロボティック・プロセス・オートメーション
Robotic process automationサロゲートモデル
Surrogate model特徴抽出
Feature engineeringQ学習
Q-learningSARSA法
State–action–reward–state–actionエンドツーエンドの強化学習
End-to-end reinforcement learning時間差分学習
Temporal difference learningモデルフリー (強化学習)
Model-free (reinforcement learning)分布ソフト・アクター・クリティック法
Distributional Soft Actor Critic