全局设置 | ||
---|---|---|
鼠标操作 |
|
|
干扰恒力 |
||
训练模式 |
|
DDPG 参数 | ||
---|---|---|
Actor 学习率 |
||
Critic 学习率 |
||
折扣因子 γ |
||
探索噪声 σ |
||
噪声衰减率 |
||
经验回放大小 |
||
Batch Size |
||
目标网络更新 τ |
||
动作范围 |
0/0
目标位置 |
000.00 |
-------- |
当前位置 |
000.00 |
-------- |
DDPG输出 |
000.00 |
-------- |
奖励 |
000.00 |
-------- |
Episode |
0 |
-------- |
噪声 σ |
0.00 |