Similar to 人間のフィードバックによる強化学習
ランダムフォレスト
Random forestLoRA
LoRAロボティック・プロセス・オートメーション
Robotic process automationサロゲートモデル
Surrogate modelハイパーパラメータ (機械学習)
Hyperparameter (machine learning)半教師あり学習
Weak supervision特徴抽出
Feature engineeringQ学習
Q-learningSARSA法
State–action–reward–state–actionエンドツーエンドの強化学習
End-to-end reinforcement learning時間差分学習
Temporal difference learningベイズ強化学習
モデルフリー (強化学習)
Model-free (reinforcement learning)分布ソフト・アクター・クリティック法
Distributional Soft Actor Critic近接方策最適化
Proximal policy optimization人工知能
Artificial intelligence▲1 trendsTemplate:主な人工知能
Template:Generative AITemplate:人工知能による存亡リスク
Template:Existential risk from artificial intelligence生成的人工知能の一覧
AI JIMY Converter
AI JIMY Paperbot
AIセーフティ
AI safety▼-1 trendsApple Intelligence
Apple IntelligenceCopilotキー
Copilot keyDABUS
DABUSDirectML
DyNet
FIELD system