DDPG 仿真小游戏

全局设置

鼠标操作

干扰恒力

训练模式

DDPG 参数

Actor 学习率

Critic 学习率

折扣因子 γ

探索噪声 σ

噪声衰减率

经验回放大小

Batch Size

目标网络更新 τ

动作范围

0/0

目标位置

000.00

--------

当前位置

000.00

--------

DDPG输出

000.00

--------

奖励

000.00

--------

Episode

0

--------

噪声 σ

0.00