differential-rl

Implementation of differential RL algorithms for average-reward continuing tasks

The implementations are based on differential algorithms introduced in Sutton and Barto's "Reinforcement Learning: an introduction" (ch. 10.3, p. 249-255, 2018), and Learning and Planning in Average-Reward Markov Decision Processes by Yi Wan, Abhishek Naik, Richard S. Sutton (2020).

Plotting script is based on @abhisheknaik96's own script.

Name		Name	Last commit message	Last commit date
Latest commit History 24 Commits
approximation		approximation
run_scripts		run_scripts
tabular		tabular
.gitignore		.gitignore
README.md		README.md
plot.py		plot.py
train.py		train.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

differential-rl

About

Releases

Packages

Languages

gabrielplicks/differential-rl

Folders and files

Latest commit

History

Repository files navigation

differential-rl

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages