Schedule

Event

Date

Description

Course Material
Lecture

08/23/2022
Tuesday

Introduction
[Course policy] [Intro2RL]
Suggested Readings:
Lecture

09/01/2022
Thursday

Basic Concepts in Reinforcement Learning
[slides]
Suggested Readings:
Lecture

09/06/2022
Tuesday

Multi-Armed Bandits
[slides]
Suggested Readings:
Assignment

09/20/2022
Tuesday

MP #1 - Bandit Algorithms released!

[MP #1 - Bandit Algorithms] [Solutions]
Lecture

09/22/2022
Thursday

Markov Decision Process
[slides]
Suggested Readings:-
Lecture

09/22/2022
Thursday

Dynamic Programming
[slides]
Suggested Readings:
Due

09/22/2022 23:59
Thursday

Project Idea Post Due
1. Required Content: Sales pitch about your course project idea, especially what makes you excited.
2. Purpose: Find your teammates who share the same passion and complementary skills
3. Where to Submit: Post on Piazza.
Lecture

09/27/2022
Tuesday

Monte Carlo Methods
[slides]
Suggested Readings:-
Quiz

09/27/2022
Tuesday

Quiz #1 - Bandit & RL Basics
[solution]

This quiz is designed to cover essential concepts in multi-armed bandit and basic concepts in reinforcement learning.
Due

10/04/2022 23:59
Tuesday

Assignment #1 due
Due

10/07/2022 23:59
Friday

Project Proposal Due
1. Required Template: You are required to use the latest ACM LaTex template for your project proposal. Among the provided templates from ACM, we ask you to use either the two column “sigconf” version or the single column “acmlarge”.
2. Maximum Length: 4 pages, excluding references and appendix.
3. Where to Submit: A collab submission page will be created. One group only needs to one proposal to collab; and please name your submission as “computingID[+computingID]*-proposal.pdf”, for example, “hw5x-cl5ev-proposal.pdf”.
Lecture

10/13/2022
Thursday

Temporal-Difference Learning
[slides]
Suggested Readings:-
Assignment

10/20/2022
Thursday

MP #2 - Markov Decision Process released!

[MP #2 - Markov Decision Process] [Solutions]
Assignment

10/22/2022
Saturday

ICLR2023 Review Assignment released!

[ICLR2023 Review Assignment]
Quiz

10/27/2022
Thursday

Quiz #2 - DP & MC
[solution]

This quiz is designed to cover essential concepts in dynamic programming and Monto Carlo methods.
Lecture

11/01/2022
Tuesday

Policy Gradient Methods
[slides]
Suggested Readings:-
Due

11/03/2022 23:59
Thursday

Assignment #2 due
Due

11/11/2022 23:59
Friday

ICLR2023 review due
Assignment

11/17/2022
Thursday

MP #3 - Policy Gradient method released!

[MP #3 - Policy Gradient method]
Lecture

11/22/2022
Tuesday

Approximation Methods
[slides]
Suggested Readings:-
Lecture

11/28/2022
Monday

Deep Reinforcement Learning
[slides]
Suggested Readings:-
Quiz

11/29/2022
Tuesday

Quiz #3 - TD & PG
[solution]

This quiz is designed to cover essential concepts in temporal difference method and policy gradient method.
Due

12/01/2022 23:59
Thursday

Assignment #3 due
Due

12/12/2022 10:30
Monday

Project Presentation
1. Presentation Location: Rice 340.
2. Presentation Length: maximum 15 minutes presentation, including Q&A, given in person.
3. Presentation format: any format you prefer, power point slides or live demonstration.
Quiz

12/12/2022
Monday

Quiz #4 - DRL & Offline RL
[solution]

This quiz is designed to cover essential concepts in deep reinforcement learning and offline reinforcement learning methods.
Due

12/15/2022 22:59
Thursday

Project Report Due
1. Required Template: You should use the same template that you have used for your project proposal.
2. Maximum Length: 8 pages, excluding references and appendix.
3. Where to Submit: A collab submission page will be created. One group only needs to one report to collab; and please name your submission as “computingID[+computingID]*-report.pdf”, for example, “hw5x-cl5ev-report.pdf”.
Lecture

12/16/2022
Friday

Offline Reinforcement Learning
Suggested Readings: