GitHub

Mountaincar by SARSA(lambda) with function approximation

based on: evangravelle's work

https://gist.github.com/evangravelle/56defd6d01ee738f7cbeb84013145a43

env: openai gym 'MountainCar-v0'

observation:

[0] position [-1.2,0.6]

[1] velocity [-0.07,0.07]

actions:

[0] push left

[1] no push

[2] push right

setting:

features: 16*16 RBF

episode length: 500 per trial

step length: 2000 per episode

hyperparameters:

alpha=0.1

lambda=0.5

gamma=0.99

epsilon0=0.1

epsilonf=0.01

results:

learning curve:

final Q:

Name		Name	Last commit message	Last commit date
Latest commit History 7 Commits
README.md		README.md
delta.npy		delta.npy
drawheatmap.py		drawheatmap.py
learning_curve.png		learning_curve.png
mtcar.py		mtcar.py
q.png		q.png
q_s2000_reso200_j.npy		q_s2000_reso200_j.npy
qvalue.npy		qvalue.npy
reward_j.npy		reward_j.npy
theta.npy		theta.npy

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Mountaincar by SARSA(lambda) with function approximation

About

Releases

Packages

Languages

ha5ha6/mtcar_sarsalambdaFA

Folders and files

Latest commit

History

Repository files navigation

Mountaincar by SARSA(lambda) with function approximation

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages