การเรียนรู้แบบเสริมแรง
3(2-3-7)
วิชาบังคับก่อน: ENG25 2100 ความรู้เบื้องต้นปัญญาประดิษฐ์
การเรียนรู้เบื้องต้นเกี่ยวกับการเรียนรู้แบบเสริมแรง กระบวนการการตัดสินใจแบบมาร์คอฟ การเรียนรู้การเสริมแรงบนพื้นฐานมูลค่า การเรียนรู้การเสริมแรงบนพื้นฐานนโยบาย การเรียนรู้ความแตกต่างทางอารมณ์ การเรียนรู้แบบคิว ระบบเครือข่ายคิวแบบเจาะลึก การประยุกต์ใช้กับปัญหาต่าง ๆ ทางวิศวกรรม
ผลสัมฤทธิ์การเรียนรู้
Reinforcement Learning
Prerequisite: ENG25 2100 Introduction to Artificial Intelligence
Introduction to reinforcement learning, Markov decision process, value-based reinforcement learning, policy-based reinforcement learning, temporal difference learning, Q-learning, Deep Q-Network, application to engineering problems.
Learning outcomes