การเรียนรู้แบบเสริมแรง
3(2-3-7)
วิชาบังคับก่อน: ENG85 3020 ความรู้เบื้องต้นปัญญาประดิษฐ์
การเรียนรู้เบื้องต้นเกี่ยวกับการเรียนรู้แบบเสริมแรง กระบวนการการตัดสินใจแบบมาร์คอฟ การเรียนรู้การเสริมแรงบนพื้นฐานมูลค่า การเรียนรู้การเสริมแรงบนพื้นฐานนโยบาย การเรียนรู้ความแตกต่างทางอารมณ์ การเรียนรู้แบบคิว ระบบเครือข่ายคิวแบบเจาะลึก การประยุกต์ใช้กับปัญหาต่าง ๆ ทางวิศวกรรม
ผลลัพธ์การเรียนรู้ที่คาดหวังระดับรายวิชา
Reinforcement Learning
Prerequisite: ENG85 3020 Introduction to Artificial Intelligence
Introduction to reinforcement learning, Markov decision process, value-based reinforcement learning, policy-based reinforcement learning, temporal difference learning, Q-learning, Deep Q-Network, application to engineering problems.
Course Learning Outcomes (CLOs)