DQN-Atari-PyTorch

Implementation of (D)-DQN (1) (2) (3) by DeepMind.

Applied to the gym Breakout, Pong and SpaceInvaders environment. *NoFrameskip-v4

Results

Training

Due to computational resource constraints, i trained Breakout and SpaceInvaders for about 11-14 million steps.
The agents would become better given more training.

Training: Breakout

Training: Pong

Training: SpaceInvaders
sparse rewards at ~(600-800) return. Often only one/two, fast moving targets left. Hard to optimize!

Name		Name	Last commit message	Last commit date
Latest commit History 6 Commits
media		media
py scripts		py scripts
.gitattributes		.gitattributes
DQN_Atari.ipynb		DQN_Atari.ipynb
README.md		README.md
evaluate_models.ipynb		evaluate_models.ipynb
plot_training.ipynb		plot_training.ipynb

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

DQN-Atari-PyTorch

Results

Training

About

Releases

Packages

Languages

Hauf3n/DDQN-Atari-PyTorch

Folders and files

Latest commit

History

Repository files navigation

DQN-Atari-PyTorch

Results

Training

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages