一、課程說明(Course Description)
本課程為開設給大四,碩士,博士的研究所課程,
為一個探討深度增強式學習的深入主題的課程。由

深度增強式學習的發展日新月異,其中包含的特殊
主題,包含探索 (Exploration)、元學習
(meta
Learning)、基於模型之增強式學習 (Model-
based Reinforcement Learning)、多代
理人增強式
學習 (Multi-Agent Reinforcement
Learning)、模仿學習 (Imitation
Learning) 等等。這些
研究主題通常並無包含於基礎的機器學習以及深度
學習課程,但卻都是最近一兩年於深度增強式學習

為前沿且最重要的研究方向。此課程將以專題討論
的模式,搭配深度增強式學習模型實作,訓練修課

生實際學習以上這些研究領域,以對深度增強式學
習領域有更優秀的研究實力。

二、指定用書(Text Books)
無,本課程將探討最新的增強式學習領域,主要將
以研究論文為主。研究論文將來自機器學習最頂尖

會議,包含NeurIPS、ICML、IJCAI、AAAI、
CoRL、AAMAS等。

三、參考書籍(References)
“Reinforcement Learning: An
Introduction” by R. S. Sutton and A.
G. Barto, Second
Edition.

四、教學方式(Teaching Method)
本課程將使用專題討論的形式,每週探討不同的深
度增強式學習的主題,教材包含最新機器學習頂尖

議的研究論文。課程中將鼓勵學生對論文內容提出
質疑,鼓勵學生提出改善方案,尤其希望參與課程

學生能夠實際將自身想法與概念經由實驗,投稿至
頂尖AI研討會。

五、教學進度(Syllabus)
本課程教學進度將根據以下進度規劃:
- 深度增強式學習基礎回顧 (Review of Deep
Reinforcement Learning Concepts) – 2
Weeks
- 探索 (Exploration) – 2 Weeks
- 元學習 (meta Learning) – 3 Weeks
- 基於模型之增強式學習 (Model-based
Reinforcement Learning) – 3 Weeks
- 多代理人增強式學習 (Multi-Agent
Reinforcement Learning) – 3 Weeks
- 模仿學習 (Imitation Learning) – 3
Weeks

六、成績考核(Evaluation)
本課程的成績將由以下方式評量:
- 課程討論參與、研究論文評析 (40%)
- 期末專題實作 (60%)

七、可連結之網頁位址 相關網頁(Personal
Website)
無,採用ILMS進行課程討論與參與,以及做也繳交
等。