Category:機械学習アルゴリズム
拡散モデル
Diffusion modelバックプロパゲーション
Backpropagation強化学習
Reinforcement learningQ学習
Q-learningK近傍法
K-nearest neighbors algorithmSARSA法
State–action–reward–state–action近接方策最適化
Proximal policy optimizationバギング
Bootstrap aggregating非負値行列因子分解
Non-negative matrix factorization分布ソフト・アクター・クリティック法
Distributional Soft Actor Critic再帰的自己改善
Recursive self-improvement時間差分学習
Temporal difference learning局所外れ値因子法
Local outlier factorID3
ID3 algorithmEMアルゴリズム
Expectation–maximization algorithm単純ベイズ分類器
Naive Bayes classifierオンライン学習
Online machine learning▼-1 trends確率的勾配降下法
Stochastic gradient descent