Category:機械学習アルゴリズム
強化学習
Reinforcement learning▲1 trendsバックプロパゲーション
Backpropagation確率的勾配降下法
Stochastic gradient descentQ学習
Q-learningK近傍法
K-nearest neighbors algorithmEMアルゴリズム
Expectation–maximization algorithm時間差分学習
Temporal difference learningバギング
Bootstrap aggregating単純ベイズ分類器
Naive Bayes classifier再帰的自己改善
Recursive self-improvement近接方策最適化
Proximal policy optimizationSARSA法
State–action–reward–state–action拡散モデル
Diffusion model分布ソフト・アクター・クリティック法
Distributional Soft Actor Critic局所外れ値因子法
Local outlier factorID3
ID3 algorithm