Q-Learning 仿真小游戏
鼠标操作
干扰恒力
训练模式
学习率 α
折扣因子 γ
探索率 ε
位置桶数
速度桶数
0/0
目标位置
000.00
--------
当前位置
QL输出
奖励
Episode
0