Tentative schedule

Week1 (-)
Week2 (September 11)
Week3 (September 18)
Week4 (September 25)
Week5 (October 2)
Week6 (October 9)
Week7 (October 16)
Week8 (October 23)
Week9 (October 30)
Week10 (November 6)
Week11 (November 13)
Week12 (November 20)
Week13 (November 27)
Week15 (December 4)
Week16 (December 11)

Week1 (-)

Schedule meeting time

Week2 (September 11)

Discuss which papers to read this semester

Week3 (September 18)

Presenter: Akash Choudhuri

Mnih, Volodymyr, Koray Kavukcuoglu, David Silver, Alex Graves, Ioannis Antonoglou, Daan Wierstra, and Martin Riedmiller. “Playing Atari with Deep Reinforcement Learning.” arXiv, December 19, 2013. https://doi.org/10.48550/arXiv.1312.5602.

Week4 (September 25)

Presenter: Yongjian Zhong

Khalil, Elias, et al. “Learning Combinatorial Optimization Algorithms over Graphs.” Advances in Neural Information Processing Systems, vol. 30, Curran Associates, Inc., 2017. Neural Information Processing Systems, https://proceedings.neurips.cc/paper/2017/hash/d9896106ca98d3d05b8cbdf4fd8b13a1-Abstract.html.

Kim, Hyeonah, et al. “Symmetric Replay Training: Enhancing Sample Efficiency in Deep Reinforcement Learning for Combinatorial Optimization.” Proceedings of the 41st International Conference on Machine Learning, PMLR, 2024, pp. 24110–36. proceedings.mlr.press, https://proceedings.mlr.press/v235/kim24o.html.

Week5 (October 2)

-Presenter: Brendan Latham

Wang, Yuanhao, et al. Is RLHF More Difficult than Standard RL? arXiv:2306.14111, arXiv, 3 Nov. 2023. arXiv.org, https://doi.org/10.48550/arXiv.2306.14111.

Week6 (October 9)

-Presenter: Brendan Latham (Continued)

Wang, Yuanhao, et al. Is RLHF More Difficult than Standard RL? arXiv:2306.14111, arXiv, 3 Nov. 2023. arXiv.org, https://doi.org/10.48550/arXiv.2306.14111.

Week7 (October 16)

Presenter: Yongjian Zhong (Continued)

Week8 (October 23)

No Meeting

Week9 (October 30)

Presenter: Jeffrey Keithley

Week10 (November 6)

Presenter: TBD

Week11 (November 13)

Presenter: TBD

Week12 (November 20)

Presenter: TBD

Week13 (November 27)

Presenter: No Meeting (Fall Break)

Week15 (December 4)

Presenter: TBD

Week16 (December 11)

No Meeting (Final Exam Week)