Similar to Q学習

SARSA法
State–action–reward–state–action
強化学習
Reinforcement learning
時間差分学習
Temporal difference learning
分布ソフト・アクター・クリティック法
Distributional Soft Actor Critic
近接方策最適化
Proximal policy optimization第721飛行隊 (デンマーク空軍)
Eskadrille 721
Algebraic Code Excited Linear Prediction
Algebraic code-excited linear predictionALGOL
ALGOL
AM 748 I 4to
AM 748 I 4to
AN/APG-63
AN/APG-63 radar family
Apple Pay
Apple PayAST・ALT比
AST/ALT ratio
Axiom (数式処理システム)
Axiom (computer algebra system)B
B
BASIC
BASIC
Blu-ray Disc
Blu-ray
Bü 133 (航空機)
Bücker Bü 133 Jungmeister
C++ Technical Report 1
C++ Technical Report 1
C-135 (航空機)
Boeing C-135 Stratolifter
MediaWiki:Citethispage-content

Cpio
Cpio
C++
C++
Darwin Information Typing Architecture
Darwin Information Typing Architecture
0
0
ID3
ID3 algorithm
K近傍法
K-nearest neighbors algorithm
EMアルゴリズム
Expectation–maximization algorithm
ガウシアン・スプラッティング
Gaussian splatting