Quantile Regression DQN

Each experiment uses 3 seeds and is trained for 10k environment steps. The parameters used for QR-DQN are the same parameters as described in the original paper.

Breakout QR-DQN - single worker

coach -p Atari_QR_DQN -lvl breakout

Pong QR-DQN - single worker

coach -p Atari_QR_DQN -lvl pong

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

README.md

README.md

Quantile Regression DQN

Breakout QR-DQN - single worker

Pong QR-DQN - single worker

Files

README.md

Latest commit

History

README.md

File metadata and controls

Quantile Regression DQN

Breakout QR-DQN - single worker

Pong QR-DQN - single worker