CS285Proj

Policy Gradient

Q Learning

Imitation Learning (i.e No teacher forcing) or Supervised Learning (i.e. Teacher forcing)

Any file with (rnnorbert) in it allows you to choose either a Bert or an RNN-based Encoder.

Data

Name		Name	Last commit message	Last commit date
Latest commit History 21 Commits
(rnnorbert)+rnn.py		(rnnorbert)+rnn.py
README.md		README.md
bertberttranslator.py		bertberttranslator.py
colab.ipynb		colab.ipynb
confusion.txt		confusion.txt
pg.py		pg.py
pg_seq2seq.py		pg_seq2seq.py
pytorch_utils.py		pytorch_utils.py
q_seq2seq.py		q_seq2seq.py
qseq_orig.py		qseq_orig.py
read_confused.py		read_confused.py
rl(rnnorbert)+rnn.py		rl(rnnorbert)+rnn.py
run_pg.py		run_pg.py
run_q.py		run_q.py
sgml2csv.py		sgml2csv.py

Provide feedback