全局设置 | ||
---|---|---|
鼠标操作 |
|
|
干扰恒力 |
||
训练模式 |
|
DQN 参数 | ||
---|---|---|
学习率 α |
||
折扣因子 γ |
||
初始探索率 ε |
||
最终探索率 ε_min |
||
探索衰减率 ε_decay |
||
经验回放大小 |
||
Batch Size |
||
目标网络更新频率 |
0/0
目标位置 |
000.00 |
-------- |
当前位置 |
000.00 |
-------- |
DQN输出 |
000.00 |
-------- |
奖励 |
000.00 |
-------- |
Episode |
0 |
-------- |
ε |
0.00 |