Category:機械学習アルゴリズム
バックプロパゲーション
Backpropagation確率的勾配降下法
Stochastic gradient descent強化学習
Reinforcement learningEMアルゴリズム
Expectation–maximization algorithmK近傍法
K-nearest neighbors algorithm単純ベイズ分類器
Naive Bayes classifierQ学習
Q-learning局所外れ値因子法
Local outlier factor時間差分学習
Temporal difference learning再帰的自己改善
Recursive self-improvement近接方策最適化
Proximal policy optimization分布ソフト・アクター・クリティック法
Distributional Soft Actor CriticSARSA法
State–action–reward–state–actionID3
ID3 algorithmバギング
Bootstrap aggregating拡散モデル
Diffusion model