Similar to Q学習
SARSA法
State–action–reward–state–action強化学習
Reinforcement learning時間差分学習
Temporal difference learning分布ソフト・アクター・クリティック法
Distributional Soft Actor Critic近接方策最適化
Proximal policy optimization1984年ロサンゼルスオリンピック
1984 Summer Olympics2024年度の将棋界
利用者:20世紀(前半)美術/主要な近現代美術家一覧
第721飛行隊 (デンマーク空軍)
Eskadrille 721Algebraic Code Excited Linear Prediction
Algebraic code-excited linear predictionALGOL
ALGOLAM 748 I 4to
AM 748 I 4toAN/APG-63
AN/APG-63 radar familyAnnals of Mathematics
Annals of MathematicsAOL
AOL▼-2 trendsAST・ALT比
AST/ALT ratioAxiom (数式処理システム)
Axiom (computer algebra system)B
BBASIC
BASICID3
ID3 algorithmK近傍法
K-nearest neighbors algorithmEMアルゴリズム
Expectation–maximization algorithm拡散モデル
Diffusion model確率的勾配降下法
Stochastic gradient descent局所外れ値因子法
Local outlier factor再帰的自己改善
Recursive self-improvement単純ベイズ分類器
Naive Bayes classifierバギング
Bootstrap aggregating