Q-Learning 仿真小游戏

全局设置

鼠标操作

干扰恒力

训练模式

Q-Learning 参数

学习率 α

折扣因子 γ

探索率 ε

位置桶数

速度桶数

0/0

目标位置

000.00

--------

当前位置

000.00

--------

QL输出

000.00

--------

奖励

000.00

--------

Episode

0