VERIFIKASI SUARA MENGGUNAKAN METODE MFCC DAN DTW MENGGUNAKAN METODE MFCC DAN DTW (BAB IV HASIL DAN PEMBAHASAN)
BAB IV
HASIL DAN PEMBAHASAN
Dalam bab ini dipaparkan mengenai rangkaian proses serta hasil dari pengujian terhadap sistem pengenalan suara yang telah dibuat. Diuraikan juga hasil dari tiap-tiap langkah ekstraksi fitur dengan metode MFCC. Dilanjutkan dengan proses pattern matching dengan metode DTW. Kemudian dilakukan simulasi pengujian dengan mencari rasio kesalahan kecocokan (FMR) dan rasio kesalahan ketidakcocokan (FNMR) sehingga diketahui unjuk kerja atau tingkat kesuksesan sistem.
4.1 Gambaran Umum
Sistem pengenalan suara dibuat secara umum terdiri dari :
1. Pengolahan sinyal suara
2. Pencocokan sinyal suara dengan metode DTW
4.1.1 Pengolahan Sinyal Suara
Tujuan dari proses pengolahan suara adalah untuk mendapatkan ciri atau parameter dari sinyal suara. Adapun tahapan-tahapannya adalah : perekaman suara, sampling, remove dc, pre-emphasize, frame blocking, windowing, FFT, filterbank, dct, cepstral liftering, dan remove silence.
4.1.1.1 Perekaman Suara (Voice Recording)
Proses perekaman suara dilakukan dengan memanfaatkan class WaveIn dari Waveform Audio Interface yang merupakan salah satu Application Programming Interfaces (APIs) yang dimiliki oleh Microsoft. Class WaveIn yang digunakan ditulis dalam bahasa c# oleh Jeff Morton. Proses perekaman suara terletak pada form Enrollment, ketika proses perekaman suara berlangsung dilakukan pula proses ekstraksi ciri dari suara yang direkam dan langsung disimpan ke dalam database sebagai data sampel, sedangkan filenya (.wav) disimpan ke dalam direktori yang telah ditentukan sebelumnya. Gambar dibawah ini merupakan form Enrollment.
Gambar 4.1 Form Enrollment
Setelah tombol start ditekan maka sistem akan secara langsung merekam suara yang diucapkan sampai tombol stop ditekan. Tombol stop akan muncul setelah tombol start ditekan. Kemudian sistem menggambarkannya ke dalam canvas berdasarkan nilai amplitudo yang diperoleh seperti terlihat pada gambar diatas. Jika dituliskan kedalam bentuk teks maka nilai ampiltudonya adalah sebagai berikut :
14, 14, -43, -62, -123, -369, -774, -885, -732, -501, -394, -457, -600, -804, -736, -842, -737, -508, -511, -507, -515, -391, -299, -322, -272, -51, -192, -229, -131, -113, -66, -58, -90, 20, 188, 278, 280, 344, 342, 188, 93, -46, -11, -21, 160, 162, -53, 113, 41, -115, -13, -62, -35, 190, 646, 1205, 1231, 1053, 113, -312, -430, -381, -483, -960, -1045, -1169, -1220, -1463, -1610, -1465, -1278, -1210, -939, -771, -1018, -1126, -944, -517, -197, 122, 679, 1400, 1330, 1212, 1276, 1131, 907, 755, 196, -337, -544, -794, -664, -302, -103, 34, 93, 241, 333, 198, 314, 463, 329, 177, 31, 64, -52, -46, -102, -47, -261, -195, -137, -442, -364, -478, -736, -913, -931, -773, -741, -813, -752, -866, -754, -722, -687, -564, -367, -465, -375, -551, -625, -29, 515, 1220, 1046, -43, -685, -461,……………..
|
Proses perekaman dilakukan dalam ruangan yang masih dipengaruhi oleh noise sehingga mempengaruhi sinyal dan data yang masuk.
*file lengkapnya dapat di dowload DISINI
maaf.. saya mau download pdfnya tetapi filenya tdk ditemukan ..
ReplyDeleteada link lain ?
terima kasih sebelumnya