Similar to Q学習
SARSA法
State–action–reward–state–action強化学習
Reinforcement learning▼-1 trends時間差分学習
Temporal difference learning分布ソフト・アクター・クリティック法
Distributional Soft Actor Critic近接方策最適化
Proximal policy optimization1945年
1945▲1 trends1984年ロサンゼルスオリンピック
1984 Summer Olympics第721飛行隊 (デンマーク空軍)
Eskadrille 721Algebraic Code Excited Linear Prediction
Algebraic code-excited linear predictionALGOL
ALGOLAM 748 I 4to
AM 748 I 4toAN/APG-63
AN/APG-63 radar familyAnnals of Mathematics
Annals of MathematicsAOL
AOLAST・ALT比
AST/ALT ratioAxiom (数式処理システム)
Axiom (computer algebra system)B
BBASIC
BASICBü 133 (航空機)
Bücker Bü 133 JungmeisterC++ Technical Report 1
C++ Technical Report 1C-135 (航空機)
Boeing C-135 StratolifterMediaWiki:Citethispage-content
Cpio
CpioC++
C++Darwin Information Typing Architecture
Darwin Information Typing ArchitectureID3
ID3 algorithmK近傍法
K-nearest neighbors algorithmEMアルゴリズム
Expectation–maximization algorithm