Why is DDPG an off-policy method while policy gradient is by definition on-policy?

Asked May 22 '19 at 14:22

Active May 22 '19 at 14:22

Viewed 25 times

DDPG is updated in an off-policy manner while policy gradient is on-policy. So DDPG is not a policy gradient method?

asked May 22 '19 at 14:22

ccc

0 Answers0