Speech Processing

การประมวลสัญญาณเสียงพูด
4(4-0-12)
วิชาบังคับก่อน: ไม่มี
การชักตัวอย่าง การควอนไทซ์แบบสเกลาร์ การควอนไทซ์แบบเวกเตอร์ การจำลองแบบสัญญาณเสียงพูด การรับรู้สัญญาณเสียงพูด การเข้ารหัสรูปคลื่น โวโคดเดอร์ การเข้ารหัสแบบไฮบริด การหาลักษณะสำคัญของสัญญาณเสียงพูด หน่วยเสียง
การฝึกแบบจำลองทางสถิติ การพิสูจน์ผู้พูด การแปลงจากตัวอักษรเป็นสัญญาณเสียงพูด เทคนิคการลดสัญญาณรบกวน
เค้าโครงรายวิชา
1. การชักตัวอย่าง (2 ชั่วโมง)
2. การควอนไทซ์แบบสเกลาร์ และแบบเวกเตอร์ (4 ชั่วโมง)
3. การจำลองแบบสัญญาณเสียงพูด (4 ชั่วโมง)
4. การรับรู้สัญญาณเสียงพูด (2 ชั่วโมง)
5. การเข้ารหัสรูปคลื่นและโวโคดเดอร์ (4 ชั่วโมง)
6. การเข้ารหัสแบบไฮบริด (2 ชั่วโมง)
7. การหาลักษณะสำคัญของสัญญาณเสียงพูด (4 ชั่วโมง)
8. การฝึกแบบจำลองทางสถิติ (6 ชั่วโมง)
9. การพิสูจน์ผู้พูด (4 ชั่วโมง)
10. การแปลงจากตัวอักษรเป็นสัญญาณเสียงพูด (8 ชั่วโมง)
11. เทคนิคการลดสัญญาณรบกวน (8 ชั่วโมง)
ผลสัมฤทธิ์การเรียนรู้
นักศึกษาเข้าใจและสามารถสร้างแบบจำลองแบบต่าง ๆ เพื่อประมวลผลสัญญาณเสียงพิสูจน์สัญญาณเสียงและพิสูจน์ผู้พูด

Speech Processing
Prerequisite: None
Sampling; scalar quantization; vector quantization; speech modeling; speech perception; waveform coding; vocoders; hybrid coding; feature extraction; statistical model training; speaker
verification; text-to-speech (TTS); noise reduction techniques
Course Outline
1. Sampling (2 hours)
2. Scalar quantization and vector quantization (4 hours)
3. Speech modeling (4 hours)
4. Speech perception (2 hours)
5. Waveform coding and vocoders; (4 hours)
6. Hybrid coding (2 hours)
7. Feature extraction (4 hours)
8. Statistical model training (6 hours)
9. Speaker verification (4 hours)
10. Text-to-speech (8 hours)
11. Noise reduction techniques (8 hours)
Learning Outcomes
The students will be able to understand and implement the various models of speech processing, verification of speech signals and speakers.