Category:機械学習アルゴリズム
拡散モデル
Diffusion model分布ソフト・アクター・クリティック法
Distributional Soft Actor CriticID3
ID3 algorithmSARSA法
State–action–reward–state–action近接方策最適化
Proximal policy optimization再帰的自己改善
Recursive self-improvement時間差分学習
Temporal difference learning局所外れ値因子法
Local outlier factorバギング
Bootstrap aggregating単純ベイズ分類器
Naive Bayes classifierEMアルゴリズム
Expectation–maximization algorithmK近傍法
K-nearest neighbors algorithmQ学習
Q-learning確率的勾配降下法
Stochastic gradient descent強化学習
Reinforcement learning▼-1 trendsバックプロパゲーション
Backpropagation▼-1 trends