Category:機械学習アルゴリズム
時間差分学習
Temporal difference learningバギング
Bootstrap aggregatingオンライン学習
Online machine learning近接方策最適化
Proximal policy optimization再帰的自己改善
Recursive self-improvement分布ソフト・アクター・クリティック法
Distributional Soft Actor CriticSARSA法
State–action–reward–state–action局所外れ値因子法
Local outlier factorニューラル・ラディアンス・フィールド
Neural radiance field非負値行列因子分解
Non-negative matrix factorizationQ学習
Q-learning拡散モデル
Diffusion modelID3
ID3 algorithm単純ベイズ分類器
Naive Bayes classifierガウシアン・スプラッティング
Gaussian splattingEMアルゴリズム
Expectation–maximization algorithm強化学習
Reinforcement learningK近傍法
K-nearest neighbors algorithmバックプロパゲーション
Backpropagation確率的勾配降下法
Stochastic gradient descent