DQN 仿真小游戏

全局设置

鼠标操作

干扰恒力

训练模式

DQN 参数

学习率 α

折扣因子 γ

初始探索率 ε

最终探索率 ε_min

探索衰减率 ε_decay

经验回放大小

Batch Size

目标网络更新频率

0/0

目标位置

000.00

--------

当前位置

000.00

--------

DQN输出

000.00

--------

奖励

000.00

--------

Episode

0

--------

ε

0.00