Category:機械学習アルゴリズム
近接方策最適化
Proximal policy optimization局所外れ値因子法
Local outlier factor再帰的自己改善
Recursive self-improvementSARSA法
State–action–reward–state–action分布ソフト・アクター・クリティック法
Distributional Soft Actor CriticID3
ID3 algorithm単純ベイズ分類器
Naive Bayes classifierバギング
Bootstrap aggregating時間差分学習
Temporal difference learning拡散モデル
Diffusion modelEMアルゴリズム
Expectation–maximization algorithmQ学習
Q-learning確率的勾配降下法
Stochastic gradient descentK近傍法
K-nearest neighbors algorithmバックプロパゲーション
Backpropagation強化学習
Reinforcement learning