Category:機械学習アルゴリズム
強化学習
Reinforcement learning▲3 trendsバックプロパゲーション
Backpropagation▲1 trendsQ学習
Q-learning確率的勾配降下法
Stochastic gradient descent▲1 trendsK近傍法
K-nearest neighbors algorithm単純ベイズ分類器
Naive Bayes classifier時間差分学習
Temporal difference learningEMアルゴリズム
Expectation–maximization algorithm再帰的自己改善
Recursive self-improvement拡散モデル
Diffusion model分布ソフト・アクター・クリティック法
Distributional Soft Actor CriticID3
ID3 algorithm局所外れ値因子法
Local outlier factor近接方策最適化
Proximal policy optimizationバギング
Bootstrap aggregatingSARSA法
State–action–reward–state–action