Please use this identifier to cite or link to this item:
http://www.repository.rmutt.ac.th/xmlui/handle/123456789/539
Title: | การพัฒนาคุณลักษณะสำคัญของสัมประสิทธิ์เซปสตรัมบนสเกลเมลสำหรับระบบการรู้จำเสียงพูด |
Other Titles: | IMPROVEMENT MFCC FEATURE FOR SPEECH RECOGNITION SYSTEM |
Authors: | สุจิตรา จีนะวงษ์ |
Keywords: | โครงข่ายประสาทเทียม สัมประสิทธิ์เซปตรัมบนสเกลเมล การรู้จำเสียงพูด |
Issue Date: | 2553 |
Publisher: | มหาวิทยาลัยเทคโนโลยีราชมงคลธัญบุรี. คณะวิศวกรรมศาสตร์. สาขาวิศวกรรมไฟฟ้า |
Abstract: | ระบบโครงข่ายประสาทเทียม (Artificial Neural Networks) ได้มีการประยุกต์ใช้ในงานวิจัย ทางด้านการรู้จำเสียงพูด ทั้งนี้ระบบโครงข่ายประสาทเทียมมีความจำเป็นที่จะต้องเรียนรู้และจดจำคุณลักษณะของสัญญาณเสียงพูด โดยการเลือกใช้พารามิเตอร์ของเสียงคำพูด การเลือกจำนวนโนดเพื่อปรับโครงสร้างของโครงข่ายประสาทเทียมให้มีความเหมาะสมกับสัญญาณนั้นๆ ทั้งนี้จากการเลือกใช้พารามิเตอร์ของเสียงคำพูดที่ไม่เหมาะสม ทำให้จำนวนโนดในชั้นอินพุตของโครงข่ายประสาทเทียมมีจำนวนมาก ส่งผลให้การคำนวณและการฝึกฝนโครงข่ายประสาทเทียมใช้เวลามากเกินไปวิทยานิพนธ์นี้นำเสนอการลดจำนวนคุณลักษณะสำคัญของสัมประสิทธิ์เซปสตรัมบนสเกลเมล(Mel Frequency Cepstral Coefficient : MFCC) สำหรับระบบการรู้จำเสียงพูด เพื่อใช้ในการฝึกฝนโครงข่ายประสาทเทียม การดึงคุณลักษณะเด่นของสัญญาณเสียงพูด จะใช้วิธีการหาค่า สัมประสิทธิ์เซปสตรัมบนสเกลเมล โดยแบ่ง เป็น 4, 5 , 6 , 7 และ 10 อันดับ ในส่วนของการรู้จำ จะใช้ระบบโครงข่ายประสาทเทียม ประเภทเพอเซปตรอนหลายชั้น (Multilayer perceptron : MLP) และ มีการเรียนรู้แบบแพร่กลับ (Backpropagation) สัญญาณเสียง ทางด้านอินพุต ได้มาจากผู้ชาย 100 คน และผู้หญิง 100 คน พูดคนละ 2 รอบ จะได้ข้อมูลเสียงพูดละ 400 เสียง นำมาฝึกฝนและทดสอบโครงข่ายประสาทเทียม ผลการทดลองพบว่า อัตราความถูกต้องของการรู้จำโดยใช้ MFCC 4 คือ 87.1% (ผู้หญิง) ใช้ เวลา ในการฝึกฝนคือ11 นาที และ80.2 % (ผู้ชาย) ใช้เวลาในการฝึกฝนคือ 12 นาที ส่วน MFCC 10 ให้อัตราการรู้จำที่ 90.9% (ผู้หญิง) และ 85.3% (ผู้ชาย) ใช้เวลาในการฝึกฝนเท่ากันคือ 22 นาที ซึ่งMFCC4 ใช้เวลาน้อยกว่า MFCC10 เกือบ 2 เท่า |
URI: | http://www.repository.rmutt.ac.th/dspace/handle/123456789/539 |
Appears in Collections: | วิทยานิพนธ์ (Thesis - EN) |
Files in This Item:
File | Description | Size | Format | |
---|---|---|---|---|
2Abstract.pdf | การพัฒนาคุณลักษณะสำคัญของสัมประสิทธิ์เซปสตรัมบนสเกลเมลสำหรับระบบการรู้จำเสียงพูด | 524.65 kB | Adobe PDF | View/Open |
Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.