VERIFIKASI SUARA MENGGUNAKAN METODE MFCC DAN DTW MENGGUNAKAN METODE MFCC DAN DTW (BAB II TINJAUAN PUSTAKA)


BAB II
TINJAUAN PUSTAKA

1.1    Konsep Dasar Pengenalan Suara
Diantara banyak komunikasi yang dilakukan oleh manusia, berbicara (speech) memberikan paling banyak informasi penting dan paling efektif dalam berkomunikasi. Informasi – informasi tersebut antara lain : gender, keadaan kesehatan, emosi, serta identitas pembicara.
Pengenalan suara dapat dikategorikan menjadi 3 bagian, yaitu : speech recognition, speaker recognition, dan language recognition. Dalam tugas akhir ini hanya khusus membahas mengenai speaker recognition lebih spesifiknya lagi membahas tentang speaker verification.
Speaker recognition adalah suatu proses yang bertujuan mengenali siapa yang sedang berbicara berdasarkan informasi yang terkandung dalam gelombang suara yang di-input-kan. Speaker recognition dibagi menjadi 2 bagian, yaitu : speaker verification dan speaker identification.
Speaker verification adalah proses verifikasi seorang pembicara, dimana sebelumnya telah diketahui identitas pembicara tersebut berdasarkan data yang telah diinputkan. Speaker verification melakukan perbandingan one to one (1:1). dalam arti bahwa fitur-fitur suara dari seorang pembicara dibandingkan secara langsung dengan firur-fitur seorang pembicara tertentu yang ada dalam sistem. Bila hasil perbandingan (skor) tersebut lebih kecil atau sama dengan batasan tertentu (treshold), maka pembicara tersebut diterima, bila tidak maka akan ditolak (dengan asumsi semakin kecil skor berarti kedua sampel semakin mirip). Gambar dibawah adalah blok diagram dari speaker verification.

Gambar 2.1 Blok Diagram Speaker Verification (Darma Putra, 2009)
Speaker identification adalah proses mendapatkan identitas dari seorang pembicara dengan membandingkan fitur-fitur suara yang diinputkan dengan semua fitur-fitur dari setiap pembicara yang ada dalam database. Berbeda dengan pada speaker verification, proses ini melakukan perbandingan one to many (1:N). 
2.2 Proses Produksi Suara
Suara adalah sebuah signal yang merambat melalui media perantara. Suara dapat dihantarkan melalui media air, udara maupun benda padat. Dengan kata lain suara adalah gelombang yang merambat dengan frekuensi dan amplitude tertentu. Suara yang dapat didengar oleh manusia berkisar antara 20 Hz sampai dengan 20 KHz, dimana Hz adalah satuan dari frekuensi yang artinya banyaknya getaran per detik (cps / cycle per second).
Perlengkapan produksi suara pada manusia secara garis besar terdiri dari jalur suara (vocal track) dan jalur hidung (nasal track). Jalur suara dimulai dari pita suara (vocal cords), celah suara (glottis) dan berakhir pada bibir. Jalur hidung dimulai dari bagian belakan langit-langit (velum) dan berakhir pada cuping hidung (nostrils).
Proses menghasilkan suara dimulai dari udara masuk ke paru-paru melalui pernafasan, kemudian melalui trakea, udara masuk ke batang tenggorokan, dimana pada batang tenggorokan ini terdapat pita suara. Pita suara ini kemudian bergetar dengan frekuensi tertentu karena adanya aliran udara tersebut sehingga dihasilkan suara. Suara yang dihasilkan ini berbeda-beda sesuai dengan posisi lidah, bibir, mulut dan langit-langit pada saat itu (Manuggal, 2005).
Suara yang dihasilkan terdiri dari tiga bagian yaitu voiced sound, unvoiced sound dan plosive sound. Voiced sound terjadi jika pita suara bergetar dengan frekuensi antara 50 Hz sampai 250 Hz. Contoh voiced sound adalah bunyi pada kata “ah”, “oh”. Unvoiced sound terjadi jika pita suara tidak bergetar sama sekali. Contoh unvoiced sound adalah bunyi “shh”. Sedangkan plosive sound terjadi jika pita suara tertutup sesaat kemudian tiba-tiba membuka. Contoh plosive sound adalah bunyi “beh” pada kata benar, “pah” pada kata pasar (Manuggal, 2005).
1.3  MFCC (Mel Frequency Cepstrum Coefficients)
MFCC (Mel Frequency Cepstrum Coefficients) merupakan salah satu medode yang banyak digunakan dalam bidang speech technology, baik speaker recognition maupun speech recognition. Metode ini digunakan untuk melakukan feature extraction, sebuah proses yang mengkonversikan signal suara menjadi beberapa parameter. Beberapa keunggulan dari metode ini adalah (Manunggal, 2005) :
a.    Mampu untuk menangkap karakteristik suara yang sangat penting bagi pengenalan suara, atau dengan kata lain dapat menangkap informasi-informasi penting yang terkandung dalam signal suara.
b.    Menghasilkan data seminimal mungkin, tanpa menghilangkan informasi-informasi penting yang dikandungnya.
c.    Mereplikasi organ pendengaran manusia dalam melakukan persepsi terhadap signal suara.
Gambar 2.2 contoh signal suara (Manuggal, 2005).
Contoh dari signal suara dapat dilihat pada Gambar diatas. Pengujian yang dilakukan untuk periode waktu yang cukup pendek (sekitar 10 sampai 30 milidetik) akan menunjukkan karakteristis signal suara yang stationary. Tetapi bila dilakukan dalam periode waktu yang lebih panjang karakteristik signal suara akan terus berubah sesuai dengan kata yang diucapkan.
            MFCC feature extraction sebenarnya merupakan adaptasi dari sistem pendengaran manusia, dimana signal suara akan difilter secara linear untuk frekuensi rendah (dibawah 1000 Hz) dan secara logaritmik untuk frekuensi tinggi (diatas 1000 Hz). Gambar dibawah ini merupakan block diagram untuk MFCC.
Gambar 2.3 Blok Diagram Untuk MFCC
2.3.1 Konversi Analog menjadi Digital
Signal – signal yang natural pada umumnya seperti signal suara merupakan signal continue dimana memiliki nilai yang tidak terbatas. Sedangkan pada komputer, semua signal yang dapat diproses oleh komputer hanyalah signal discrete atau sering dikenal sebagai istilah digital signal. Agar signal natural dapat diproses oleh komputer, maka harus diubah terlebih dahulu dari data signal continue menjadi discrete. Hal itu dapat dilakukan melalui 3 proses, diantaranya adalah proses sampling data, proses kuantisasi, dan proses pengkodean.
Proses sampling adalah suatu proses untuk mengambil data signal continue untuk setiap periode tertentu. Dalam melakukan proses sampling data, berlaku aturan Nyquist, yaitu bahwa frekuensi sampling (sampling rate) minimal harus 2 kali lebih tinggi dari frekuensi maksimum yang akan di sampling. Jika signal sampling kurang dari 2 kali frekuensi maksimum signal yang akan di sampling, maka akan timbul efek aliasing. Aliasing adalah suatu efek dimana signal yang dihasilkan memiliki frekuensi yang berbeda dengan signal aslinya.
Proses kuantisasi adalah proses untuk membulatkan nilai data ke dalam bilangan-bilangan tertentu yang telah ditentukan terlebih dahulu. Semakin banyak level yang dipakai maka semakin akurat pula data signal yang disimpan tetapi akan menghasilkan ukuran data besar dan proses yang lama.
Proses pengkodean adalah proses pemberian kode untuk tiap-tiap data signal yang telah terkuantisasi berdasarkan level yang ditempati.
Gambar 2.4 Proses Pembentukan signal digital.
Remove DC Components bertujuan untuk menghitung rata-rata dari data sampel suara, dan mengurangkan nilai setiap sampel suara dengan nilai rata-rata tersebut. Tujuannya adalah mendapat normalisasi dari data suara input.
y[n] = x[n] -   , 0 ≤ n ≤  N-1
Dimana y[n] = sampel signal hasil proses DC removal
  x[n]= sampel signal asli
    = nilai rata-rata sampel signal asli.
N   = panjang signal
2.3.3 Pre – emphasize Filetering
Pre – emphasize Filetering merupakan salah satu jenis filter yang sering digunakan sebelum sebuah signal diproses lebih lanjut. Filter ini mempertahankan frekuensi-frekuensi tinggi pada sebuah spektrum, yang umumnya tereliminasi pada saat proses produksi suara.
Tujuan dari Pre – emphasize Filetering ini adalah (Manunggal, 2005) :
a.    Mengurangi noise ratio pada signal, sehingga dapat meningkatkan kualitas signal.
b.    Menyeimbangkan spektrum dari voiced sound. Pada saat memproduksi voiced sound, glottis manusia menghasilkan sekitar -12 dB octave slope. Namun ketika energy akustik tersebut dikeluarkan melalui bibir, terjadi peningkatan sebesar +6. Sehingga signal yang terekam oleh microphone adalah sekitar -6 dB octave slope. Dampak dari efek ini dapat dilihat pada gambar dibawah ini.
Gambar 2.5 Contoh dari pre-emphasize pada sebuah frame
            Pada gambar diatas terlihat bahwa distribusi energi pada setiap frekuensi terlihat lebih seimbang setelah diimplementasikan pre-emphasize filter.
            Bentuk yang paling umum digunakan dalam pre-emphasize filter adalah sebagai berikut :
H(z) = 1 - αz -1       ............................................................................................ (2.1)
Dimana 0.9 ≤ α ≤ 1.0, dan α € R. Formula diatas dapat dijadikan sebagain first order differentiator, sebagai berikut:
y[n] = s[n] – α s[n - 1]    ................................................................................... (2.2)
Dimana y[n] = signal hasil pre-emphasize filter
              s[n] = signal sebelum pre-emphasize filter
Pada umumnya nilai α yang paling sering digunakan adalah antara 0.9 sampai 1.0. Respon frequensi dari filter tersebut adalah:
 
               .............................................................. (2.3)
Sehingga, squared magnitude response dapat dihitung dengan persamaan berikut ini:
 =  +
                 =
                 =
                 =  ................................................................... (2.4)
Magnitude response (dB scale) untuk nilai α yang berbeda dapat dilihat pada gambar dibawah:
Gambar 2.6 Magnitude response dari pre-emphasize filter untuk nilai α yang berbeda
2.3.4 Frame Blocking
Karena signal suara terus mangalami perubahan akibat adanya pergeseran artikulasi dari organ produksi vocal, signal harus diproses secara short segments (short frame). Panjang frame yang biasanya digunakan untuk pemrosesan signal adalah antara 10-30 milidetik. Panjang frame yang digunakan sangat mempengaruhi keberhasilan dalam analisa spektral. Di satu sisi, ukuran dari frame harus sepanjang mungkin untuk dapat menunjukkan resolusi frekuensi yang baik. Tetapi di lain sisi, ukuran frame juga harus cukup pendek untuk dapat menunjukkan resolusi waktu yang baik.
Gambar 2.7 Short Term Spectral Analysis (Manunggal, 2005)
Proses frame ini dilakukan terus sampai seluruh signal dapat diproses. Selain itu, proses ini umumnya dilakukan secara overlapping untuk setiap frame- nya. Panjang daerah overlap yang umum digunakan adalah kurang lebih 30% sampai 50% dari panjang frame. Overlapping dilakukan untuk menghindari hilangnya ciri atau karakteristik suara pada perbatasan perpotongan setiap frame.

2.3.5 Windowing
Proses framing dapat menyebabkan terjadinya kebocoran spektral (spectral leakage) atau aliasing. Aliasing adalah signal baru dimana memiliki frekuensi yang berbeda dengan signal aslinya. Efek ini dapat terjadi karena rendahnya jumlah sampling rate, ataupun karena proses frame blocking dimana menyebabkan signal menjadi discontinue. Untuk mengurangi kemungkinan terjadinya kebocoran spektral, maka hasil dari proses framing harus melewati proses window.
Sebuah fungsi window yang baik harus menyempit pada bagian main lobe dan melebar pada bagian side lobe-nya.
Berikut ini adalah representasi dari fungsi window terhadap signal suara yang diinputkan.
  n= 0,1,…,N-1 ................................................................. (2.5)
 = nilai sampel signal hasil windowing
 = nilai sampel dari frame signal ke i
 = fungsi window
N       frame size, merupakan kelipatan 2
            Ada banyak fungsi window, namun yang paling sering digunakan dalam aplikasi speaker recognition adalah hamming window. Fungsi window ini menghasilkan sidelobe level yang tidak terlalu tinggi (kurang lebih -43 dB), selain itu noise yang dihasilkan pun tidak terlalu besar.
Fungsi Hamming window adalah sebagai berikut :
Dimana : n = 0,1,...,M-1
                 M = panjang frame
Analisis fourier adalah sebuah metode yang memungkinkan untuk melakukan analisa terhadap spectral properties dari signal yang diinputkan. Representasi dari spectral properties sering disebut sebagai spectrogram.
Dalam spectrogram terdapat hubungan yang sangat erat antara waktu dan frekuensi. Hubungan antara frekuensi dan waktu adalah hubungan berbanding terbalik. Bila resolusi waktu yang digunakan tinggi, maka resolusi frekuensi yang dihasilkan akan semakin rendah.
2.3.6.1 Discrete Fourier Transform (DFT)
DFT merupakan perluasan dari transformasi fourier yang berlaku untuk signal-signal diskrit dengan panjang yang terhingga. Semua signal periodik terbentuk dari gabungan signal-signal sinusoidal yang menjadi satu yang dapat dirumuskan sebagai berikut :

                                                                                     ........................................................... (2.6)
N       = jumlah sampel yang akan diproses (N  N)
S(n)  = nilai sampel signal
K       = variable frekuensi discrete, dimana akan bernilai (k = )
            Dengan rumus diatas, suatu signal suara dalam domain waktu dapat kita cari frekuensi pembentuknya. Hal inilah tujuan penggunaan analisa fourier pada data suara, yaitu untuk merubah data dari domain waktu menjadi data spektrum di domain frekuensi. Untuk pemrosesan signal suara, hal ini sangatlah menguntungkan karena data pada domain frekuensi dapat diproses dengan lebih mudah dibandingkan data pada domain waktu, karena pada domain frekuensi, keras lemahnya suara tidak seberapa berpengaruh.
Gambar 2.8 Domain Waktu menjadi Domain Frekuensi

Untuk mendapatkan spektrum dari sebuah signal dengan DFT diperlukan N buah sampel data berurutan pada domain waktu, yaitu x[m] sampai x[m+N-1]. Data tersebut dimasukkan dalam fungsi DFT maka akan menghasilkan N buah data. Namun karena hasil dari DFT adalah simetris, maka hanya N/2 data yang diambil sebagai spektrum.
2.3.6.2 Fast Fourier Transform (FFT)
Perhitungan DFT secara langsung dalam komputerisasi dapat menyebabkan proses perhitungan yang sangat lama. Hal itu disebabkan karena dengan DFT, dibutuhkan  perkalian bilangan kompleks. Karena itu dibutuhkan cara lain untuk menghitung DFT dengan cepat. Hal itu dapat dilakukan dengan menggunakan algoritma fast fourier transform (FFT) dimana FFT menghilangkan proses perhitungan yang kembar dalam DFT.
2.3.7 Mel Frequency Wrapping
Mel Frequency Wrapping umumnya dilakukan dengan menggunakan Filterbank. Filterbank adalah salah satu bentuk dari filter yang dilakukan dengan tujuan untuk mengetahui ukuran energi dari frequency band tertentu dalam signal suara. Filterbank dapat diterapkan baik pada domain waktu maupun pada domain frekuensi, tetapi untuk keperluan MFCC, filterbank harus diterapkan dalam domain frekuensi. Gambar 2.9 menunjukkan dua jenis fileterbank magnitude. Dalam kedua kasus pada Gambar 2.9 filter yang dilakukan adalah secara linear terhadap frekuensi 0-4 kHz.
Gambar 2.9 magnitude dari rectangular dan triangular filterbank
Filterbank menggunakan representasi konvolusi dalam melakukan filter terhadap signal. Konvolusi dapat dilakukan dengan melakukan multiplikasi antara spektrum signal dengan koefisien filterbank. Berikut ini adalah rumus yang digunakan dalam perhitungan filterbanks.
.......................................................................................... (2.7)
N                     = jumlah magnitude spectrum (N N)
S[j]                  = magnitude spectrum pada frekuensi j
Hi[j]                = koefisien filterbank pada frekuensi j (1 ≤ i M )
M                     = jumlah channel dalam filterbank
            Persepsi manusia terhadap frekuensi dari signal suara tidak mengikuti linear scale. Frekuensi yang sebenarnya (dalam Hz) dalam sebuah signal akan diukur manusia secara subyektif dengan menggunakan mel scale. Mel frequency scale adalah linear frekuensi scale pada frekuensi dibawah 1000 Hz, dan merupakan logarithmic scale pada frekuensi diatas 1000 Hz.
2.3.8 Discrete Cosine Transform (DCT)
DCT merupakan langkah terakhir dari proses utama MFCC feature extraction. Konsep dasar dari DCT adalah mendekorelasikan mel spectrum sehingga menghasilkan representasi yang baik dari property spektral local. Pada dasarnya konsep dari DCT sama dengan inverse fourier transform. Namun hasil dari DCT mendekati PCA (principle component analysis). PCA adalah metode static klasik yang digunakan secara luas dalam analisa data dan kompresi. Hal inilah yang menyebabkan seringkali DCT menggantikan inverse fourier transform dalam proses MFCC feature extraction.
Berikut adalah formula yang digunakan untuk menghitung DCT.
................................... (2.8)
Sk     = keluaran dari proses filterbank pada index k
K    = jumlah koefisien yang diharapkan
Koefisien ke nol dari DCT pada umumya akan dihilangkan, walaupun sebenarnya mengindikasikan energi dari frame signal tersebut. Hal ini dilakukan karena, berdasarkan penelitian-penelitian yang pernah dilakukan, koefisien ke nol ini tidak reliable terhadap speaker recognition.
2.3.9 Cepstral Liftering
Hasil dari proses utama MFCC feature extraction memiliki beberapa kelemahan. Low order dari cepstral coefficients sangat sensitif terhadap spectral slope, sedangkan bagian high ordernya sangat sensitif terhadap noise. Oleh karena itu, cepstral liftering menjadi salah satu standar teknik yang diterapkan untuk meminimalisasi sensitifitas tersebut.
Cepstral liftering dapat dilakukan dengan mengimplementasikan fungsi window terhadap cepstral features.
.................................................... (2.9)
L     = jumlah cepstral coefficients
N    = index dari cepstral coefficients
Cepstral liftering menghaluskan spektrum hasil dari main processor sehingga dapat digunakan lebih baik untuk pattern matching. Gambar berikut ini menunjukkan perbandingan spektrum dengan dan tanpa cepstral liftering.
Gambar 2.10 Perbandingan spectrum dengan dan tanpa cepstral liftering
Berdasarkan Gambar 2.8, dapat dilihat bahwa pola spectrum setelah dilakukan cepstral liftering lebih halus daripada spektrum yang tidak melalui tahap spectrum liftering. Dalam beberapa jurnal dikatakan bahwa cepstral liftering dapat meningkatkan akurasi dari aplikasi pengeluaran suara, baik speaker recognition maupun speech recognition.
Satu masalah yang cukup rumit dalam speech recognition (pengenalan wicara) adalah proses perekaman yang terjadi seringkali berbeda durasinya, biarpun kata atau kalimat yang diucapkan sama. Bahkan untuk satu suku kata yang sama atau vocal yang sama seringkali proses perekaman terjadi dalam durasi yang berbeda. Sebagai akibatnya proses matching antara sinyal uji dengan sinyal referensi (template) seringkali tidak menghasilkan nilai yang optimal.
Sebuah teknik yang cukup popular di awal perkembangan teknologi pengolahan sinyal wicara adalah dengan memanfaatkan sebuah teknik dynamic-programming yang juga lebih dikenal sebagai Dynamic Time Warping (DTW). Teknik ini ditujukan untuk mengakomodasi perbedaan waktu antara proses perekaman saat pengujian dengan yang tersedia pada template sinyal referensi. Prinsip dasarnya adalah dengan memberikan sebuah rentang 'steps' dalam ruang (dalam hal ini sebuah frame-frame waktu dalam sample, frame-frame waktu dalam template) dan digunakan untuk mempertemukan lintasan yang menunjukkan local match terbesar (kemiripan) antara time frame yang lurus. Total `similarity cost' yang diperoleh dengan algorithm ini merupakan sebuah indikasi seberapa bagus sample dan template ini memiliki kesamaan, yang selanjutnya akan dipilih best-matching template.
DTW (DynamicTime Warping) adalah metode untuk menghitung jarak antara dua data time series. Keunggulan DTW dari metode jarak yang lainnya adalah mampu menghitung  jarak dari dua vektor data dengan panjang berbeda.
Jarak DTW diantara dua vektor dihitung dari jalur pembengkokkan optimal (optimal warping path) dari kedua vektor tersebut. Ilustrasi pencocokan dengan metode DTW ditunjukkan pada gambar dibawah ini.

(a)                                                                    (b)
Gambar 2.11 Pencocokan sequence (a) alignment asli dari 2 sequence (b) alignment dengan DTW (Darma Putra, 2009).
Dari beberapa teknik yang digunakan untuk menghitung DTW, salah satu yang paling handal adalah dengan metode pemrograman dinamis. Jarak DTW dapat dihitung dengan rumus:
..................................................... (2.10)

Kolom dengan nilai  dinamakan matriks jarak terjumlahkan. Berikut ini adalah contoh matriks jarak terjumlahkan:
Gambar 2.12 Ilustrasi matrik jarak terjumlahkan (cumulative distance matrix) antara 2 vektor. U={2,5,2,5,3}, V={0,3,6,0,6,1}
 
 
 
Dalam speaker recognition, DTW merupakan metode yang paling sering digunakan khususnya dalam proses pencocokan suara.
Pengenalan biometrika merupakan pengenalan otomatis terhadap individu berdasarkan karakteristik fisiologi maupun perilakunya. Setiap karakteristik bentuk fisik dan atau perilaku manusia dapat digunakan sebagai karakteristik biometrika sepanjang ia memenuhi persyaratan sebagai berikut :
·      Universalitas : setiap orang harus memiliki karakteristik yang digunakan.
·      Adanya perbedaan : dua orang harus cukup untuk dibedakan berdasarkan karakteristik tersebut
·      Permanen : Karakteristik tersebut tidak boleh berubah (berdasarkan suatu kriteria) sejalan dengan perubahan waktu.
·      Kolektabilitas : Karakteristik tersebut dapat diukur secara kuantitatif.
     Namun demikian di dalam praktek sistem biometrika ini, ada beberapa hal yang perlu dipertimbangkan :
·      Unjuk kerja : yang merupakan keakuratan dan kecepatan pengenalan yang diperoleh, sumber daya yang dibutuhkan, termasuk faktor operasional dan lingkungan yang mempengaruhi.
·      Bisa diterima masyarakat : yang mengindikasikan penerimaan dari pengguna terhadap sistem biometrika ini dalam kehidupan sehari-harinya.
·      Tidak mudah dikelabui : yaitu yang mengindikasikan seberapa mudah sistem dapat dikelabui dengan menggunakan metoda yang curang.
Sebuah sistem biometrika harus memenuhi keakuratan pengenalan dan kecepatan tertentu, kebutuhan sumber daya, tidak berbahaya bagi pengguna, dapat diterima oleh populasi pengguna, dan cukup tahan terhadap kecurangan atau serangan terhadap sistemnya.
Sebuah sistem biometrika adalah sistem pengenalan yang bekerja dengan mengambil data biometrika dari individu tertentu, mencari fitur dari data yang diperoleh dan membandingkan fitur ini dengan fitur yang ada dalam basis data. Dalam konteks aplikasi, sebuah sistem biometrika dapat bekerja dalam dua cara :
·                     Verifikasi, sistem mengesahkan identitas seseorang dengan membandingkan data biometrika yang diperoleh dengan data biometrikanya sendiri yang telah disimpan sebelumnya dalam basis data. Dalam sistem seperti ini pengguna biasanya memberikan identitasnya, seperti PIN (Personal Identification Number), username, kartu pintar dan lain-lain.
·                     Dalam mode identifikasi, sistem mengenali individu dengan mencari data semua pengguna di dalam basisdata untuk mencari satu kecocokan. Dalam hal ini sistem melakukan pembandingan satu-ke-banyak tanpa meminta identitas dari pengguna.
Perlu diketahui bahwa pengukuran biometrika dari individu yang sama yang diambil pada waktu yang berbeda hampir tidak pernah identik. Inilah alasan mengapa digunakan nilai ambang sebagai toleransi.
Sistem biometrika didesain dengan menggunakan lima modul utama sebagai berikut:
1.      Modul sensor (sensor modul), merupakan modul untuk pengumpulan data atau akuisisi data, yang mengambil (captured) data biometrika dari pengguna, dan mengolahnya menjadi bentuk yang layak untuk proses pengolahan berikutnya.
2.      Modul pemisahan ciri (feature extraction modul), yaitu modul untuk menghasilkan ciri unik dari biometrika yang digunakan yang dapat membedakan antara satu orang dengan yang lainnya. Modul ini akan mengubah data dari modul sensor kedalam bentuk yang diperlukan oleh modul pencocokan.
3.      Modul pencocokan (matching modul), yaitu modul untuk menentukan tingkat kesamaan/ketidaksamaan antara ciri biometrika yang diuji dengan ciri biometrika acuan pada basisdata
4.      Modul keputusan (decision modul), yaitu modul untuk memutuskan apakah pengguna yang diuji sah atau tidak sah berdasarkan skor hasil pencocokan. Sah atau tidak sahnya pengguna diputuskan berdasarkan suatu nilai ambang (threshold).
5.      Modul penyimpanan data (storage modul), merupakan modul untuk mendaftarkan/menyimpan ciri biometrika pengguna ke dalam basisdata acuan. Basisdata ini yang akan digunakan sebagai acuan saat proses pengenalan.
Rasio kesalahan pencocokan menyatakan probabilitas terjadinya kesalahan pencocokan pada sistem. Terdapat 2 jenis rasio kesalahan pencocokan, yaitu: rasio kesalahan kecocokan (false match rate) dan rasio kesalahan ketidakcocokan (false non match rate).
1.        Rasio Kesalahan Kecocokan
False match rate (FMR) menyatakan probabilitas sampel dari pengguna cocok dengan acuan yang diambil secara acak milik pengguna yang berbeda. False match rate disebut juga false positive.
Rasio kesalahan kecocokan dihitung dengan rumus:
2.        Rasio Kesalahan Ketidakcocokan
False non match rate (FNMR) menyatakan probabilitas sampel dari pengguna tidak cocok dengan acuan lain yang diberikan pengguna yang sama. False non match rate disebut juga False negative.
Rasio kesalahan ketidakcocokan dihitung dengan rumus:
3.        Nilai Ambang (Thresold Value)
Nilai ambang, yang sering dilambangkan dengan T, memegang peranan penting dalam memutuskan terjadinya kesalahan dalam pencocokan. Nilai FAR/FRR atau FMR/FNMR tergantung pada besarnya nilai ambang yang digunakan. Nilai T akan dibandingkan dengan skor hasil dan bila memenuhi kondisi Skor ≥ T, maka pengguna dinyatakan sah, bila tidak, maka pengguna dinyatakan tidak sah.
Misalkan skor pencocokan dua sampel adalah 0.3, dan T ditentukan 0.2, maka  akan dihasilkan keputusan bahwa pengguna adalah sah (karena 0.3 ≥ 0.2). Bila kedua sampel berasal dari pengguna sama, maka keputusan tersebut adalah BENAR dan tidak memunculkan kesalahan, akan tetapi bila kedua sampel berasal dari pengguna berbeda, maka keputusan tersebut adalah SALAH dan akan memperbesar nilai FMR atau FAR.
 Seandainya T yang digunakan adalah 0.4, maka akan dihasilkan keputusan bahwa pengguna adalah tidak sah (karena  0.3 ≤ 0.4). Bila kedua sampel berasal dari pengguna berbeda, maka keputusan tersebut adalah BENAR dan tidak memunculkan kesalahan, akan tetapi bila kedua sampel berasal dari pengguna sama, maka keputusan tersebut adalah SALAH dan akan memperbesar nilai FNMR atau FRR.
Setiap nilai T akan berkaitan dengan FMR/FNMR atau FAR/FRR. Pada pengujian suatu sistem biometrika akan menggunakan berbagai nilai T untuk mengetahui unjuk kerja terbaik sistem tersebut.
Pada beberapa literatur, ada yang menggunakan kondisi Skor ≤ T untuk menyatakan pengguna sah (bukan Skor ≥ T). Hal ini tidak perlu dipermasalahkan karena hanya bertolak dari asumsi yang berbeda. Kondisi Skor ≥ T dipakai karena menggunakan asumsi semakin besar skor berarti kedua sampel semakin mirip, sedangkan kondisi Skor ≤ T dipakai karena menggunakan asumsi semakin kecil skor berarti kedua sampel semakin mirip. 
4.        Grafik Receiver Operation Characteristics (ROC)
Grafik Karakteristik Operasi Penerima (ROC) adalah grafik yang digunakan untuk menunjukkan unjuk kerja suatu sistem biometrika. Berdasarkan studi beberapa literatur, ROC memiliki 3 jenis model grafik seperti ditunjukkan pada Gambar 2.13 (Darma Putra, 2009).
FRR


(a)
(b)
(c)
Gambar 2.13 Berbagai model grafik Receiver Operation Characteristics (ROC)
Sumbu x pada Gambar 2.13 (a), menyatakan nilai ambang dan sumbu y menyatakan FAR/FRR atau FMR/FNMR, pada Gambar 2.13 (b), sumbu x menyatakan FRR (FNMR) dan sumbu y menyatakan FAR (FMR), sedangkan pada Gambar 2.13 (c) sumbu x menyatakan FAR (FMR) dan sumbu y menyatakan GAR (Genuine Acceptance Rate). Salah satu dari ketiga grafik tersebut dapat digunakan untuk mewakili unjuk kerja suatu sistem biometrika.
GAR menyatakan tingkat kesuksesan pengenalan suatu sistem biometrika (bukan tingkat kesalahan), dan dapat dinyatakan sebagai:
            GAR = 1 – FRR, atau
            GAR = 1 – FNMR
Menghitung GAR berarti menghitung seberapa besar sistem sukses mengenali pengguna secara benar.
Perhatikan Gambar 2.13 (a). Semakin tinggi nilai ambang, maka rasio kesalahan penolakan akan berkurang dan rasio kesalahan penerimaan akan bertambah, dan semakin rendah nilai ambang maka kesalahan penolakan akan bertambah dan kesalahan penerimaan akan berkurang. Kedua jenis kesalahan ini berbanding terbalik secara berimbang. Kedua kurva FAR (FMR) dan FRR (FNMR) menyilang pada suatu titik dengan nilai FAR sama dengan FRR. Nilai pada titik perpotongan ini disebut dengan tingkat kesalahan sama/equal error rate (EER) atau crossover error rate (CER). Dalam praktek nilai ini tidak digunakan, akan tetapi sering dijadikan indikator tingkat akurasi suatu sistem biometrika. Sebagai contoh, dua sistem biometrika A dan B masing-masing memiliki EER=0.1% dan 0.46% berarti sistem biometrika A menghasilkan untuk kerja lebih akurat dibandingkan sistem biometrika B.
5.        Grafik Distribusi Pengguna Asli (Genuine) dan Palsu (Impostor)
Seluruh skor hasil pencocokan pengguna asli dan pengguna palsu akan membentuk suatu grafik distribusi seperti ditunjukkan pada Gambar 2.6 (Darma Putra, 2009).
FNMR
FMR

Gambar 2.14 Grafik distribusi pengguna asli (sah) dan pengguna palsu (tidak sah) 
(Darma Putra, 2009)
Pada gambar diatas, sumbu x menyatakan skor hasil pencocokan seluruh pasangan sampel pada saat pengujian, sedangkan sumbu y menyatakan prosentase kemunculan skor terkait (grafik tersebut menggunakan asumsi semakin besar skor berarti pasangan sampel semakin mirip). Bagian tumpang tindih dari kedua distribusi pengguna di atas merupakan bagian terjadinya kesalahan, dan nilai T akan menentukan probabilitas kesalahan (FMR/FNMR atau FAR/FRR). Pada umumnya, semakin besar ukuran database (jumlah pengguna pada database) maka bagian tumpang tindih akan semakin besar dan ini berarti FMR/FNMR atau FAR/FRR meningkat, demikian pula berlaku sebaliknya.
Ada sejumlah karakteristik dari biometrika yang digunakan dalam berbagai jenis aplikasi. Masing-masing biometrika memiliki kelebihan dan kekurangan, dan tergantung pada bidang penerapannya. Sebagai contoh, kemampuan membedakan dari biometrika suara jauh lebih rendah dari sidik jari, akan tetapi bila digunakan untuk aplikasi pengenalan diri melalui jaringan telepon, maka biometrika suara lebih cocok dibandingkan sidik jari, tapi bila diterapkan untuk sistem keamanan dengan popolusi banyak (bukan pada jaringan telepon), maka biometrika sidik jari lebih cocok.
Berikut gambar berbagai contoh sistem biometrika.
Gambar 2.15 Contoh Karakteristik Biometrika: (a) DNA, (b) telinga, (c) wajah, (d) jejak panas pada wajah,( e) jejak panas pada tangan, (f) pembuluh darah tangan, (g) sidik jari, (h) gaya berjalan, (i) ukuran tangan, (j) selaput pelangi, (k) telapak tangan, (l) retina, (m) tandatangan, dan (n) suara (Darma Putra, 2009).
Perbandingan antara suatu sistem biometrika spesifik dan suatu aplikasi ditentukan tergantung atas cara kerja dari aplikasi dan sifat dari  karakteristik biometrika. Berikut ini adalah suatu ringkasan tentang biometrika yang biasa digunakan :
Sistem pengenalan berbasis suara (voice) merupakan bagian dari pemrosesan suara (speech processing) yang memiliki cabang-cabang pemrosesan seperti terlihat pada gambar berikut :

 Gambar 2.16 Bagian dari speech processing (Campbell, Joseph, 2008).

Sistem pengenalan berbasis suara menganalisis bentuk gelombang dan pola tekanan udara yang dihasilkan ketika seseorang berbicara ke dalam mikrofon.
Biometrika suara adalah suatu kombinasi dari karakteristik tingkah laku dan fisiologis. Mulut, rongga hidung, bibir, gigi dan bagian-bagian pembentuk suara yang lain merupakan karakteristik fisiologis (fisik) yang berkaitan. Sedangkan bagaimana seseorang mengeluarkan suaranya dan tekanan udara yang bevariasi sepanjang waktu pembicaraan merupakan karakteristik tingkah laku.
Gambar 2.17 Karakteristik  fisiologis yang berkaitan dengan bagian-bagian pembentukan suara (Campbell, Joseph, 2008).
Pada umumnya sistem verifikasi pengenalan pembicara menggunakan smart card untuk kombinasi peningkatan keamanan dengan suara pengguna sistem. Hal itu dapat dilihat pada gambar berikut:
 
Gambar 2.18 Sistem pengenalan pembicara menggunakan smart card (Campbell, Joseph, 2008).

Sistem pengenalan pembicara ini memiliki modul-modul yang mengikuti modul sistem biometrika, seperti  tampak pada gambar berikut:

Gambar 2.19 Modul sistem pengenalan pembicara (Campbell, Joseph, 2008).

Beberapa feature yang dapat digunakan dalam speech coding and recognition diantaranya  reflection coefficients (RCs), log-area  ratios  (LARs)  atau  arcsin  of  the  RCs,  line  spectrum  pair  (LSP)  frequencies, the LP cepstrum dan Mel-Warped Cepstrum. Feature yang paling populer adalah Mel-Warped Cepstrum yang tidak menggunakan Analisis Linear Prediction.
Feature yang didapat akan disimpan dalam vektor ciri dan dapat dicocokan dengan metrika pencocokan seperti Euclidian distance atau metrika lainnya. Adapun metrika pencocokan yang sangat terkenal untuk pengenalan berbasis suara adalah Dynamic Time Warping (DTW).
Penerapan pengenalan berbasis suara bukannya tanpa hambatan. Suara seseorang dapat berubah sehubungan dengan perkembangan jaman, kondisi-kondisi medis (seperti kedinginan), emosional, dan lain lain merupakan faktor-faktor yang akan mempengaruhi sistem berbasis biometrika suara. Memisahkan derau latar belakang (background noise) merupakan tantangan terberat dalam membangun sistem berbasis biometrika suara.
Suatu sistem yang tidak berbasis teks dapat mengenali pembicara namun tidak terikat pada apa yang dia bicarakan. Jadi lebih sukar untuk mendisain sistem yang tidak bergantung pada teks yang diucapkan tetapi menawarkan perlindungan lebih baik dari penipuan. Pengenalan pembicara adalah paling sesuai di dalam aplikasi berbasis telepon tetapi isyarat suara dalam telepon secara khas diturunkan mutunya oleh mikrofon dan saluran komunikasi.
Bentuk dari telinga dan struktur dari jaringan pinna kartilago dapat dijadikan biometrika yang dapat membedakan seseorang dari orang lainnya. Pendekatan yang dilakukan adalah berdasarkan pada pertemuan dari titik-titik pada bagian atas pinna yang menonjol pada telinga. Ciri yang dihasilkan dari telinga tidaklah begitu unik untuk melakukan pengenalan diri.
Sistem pengenalan seseorang dengan wajah tidak mengganggu kenyamanan seseorang saat akuisisi citra. Citra wajah mungkin merupakan karakteristik biometrika yang paling umum digunakan oleh manusia untuk sistem pengenalan. Aplikasi pengenalan wajah meliputi pengenalan wajah yang statis atau terkontrol sampai sistem identifikasi wajah dinamis yang tak terkontrol di dalam suatu latar belakang yang terbaur (contohnya di bandara udara). Pendekatan yang paling umum untuk pengenalan wajah didasarkan pada bentuk dan penempatan atribut wajah, seperti mata, alis mata, hidung, bibir, dan dagu serta hubungan antara atribut tersebut atau analisis wajah secara keseluruhan yang menghadirkan suatu wajah sebagai suatu kombinasi dari sejumlah wajah kanonik. Meskipun unjuk kerja dari sistem pengenalan wajah yang secara komersial tersedia cukup layak, sistem ini memiliki batasan atas bagaimana citra wajah diperoleh yang kadang menuntut suatu latar belakang sederhana dan penerangan khusus. Sistem ini juga mempunyai kesukaran didalam mengenali suatu wajah dari dua sudut pandang (pose) yang berbeda dan di bawah kekuatan penerangan dengan kondisi yang berbeda-beda. Agar dalam praktek, suatu sistem pengenalan wajah dapat bekerja dengan baik, maka sistem harus secara  otomatis dapat (i) mendeteksi kehadiran wajah pada citra yang diperoleh; (ii) menempatkan wajah jika ada; dan (iii) mengenali wajah dari suatu sudut pandang umum (dari berbagai pose).
Pola dari panas yang dipancarkan oleh tubuh adalah suatu karakteristik dari suatu individu dan dapat ditangkap oleh suatu kamera inframerah dengan cara yang mudah seperti foto biasa (spektrum-tampak). Teknologi ini bisa digunakan untuk pengenalan tempat berlindung. Suatu sistem penjejak panas tidak memerlukan kontak, tetapi dituntut untuk mendapatkan gambaran dalam lingkungan yang tak terkendali, dimana terdapat panas memancar dari permukaan (misalnya: alat pemanas dan pipa pembuangan panas) pada lingkungan sekitar  badan. Sebuah teknologi yang menggunakan pencitraan dekat inframerah digunakan untuk meneliti punggung suatu tangan yang dikepalkan untuk menentukan struktur pembuluh darah tangan. Sensor inframerah sangat mahal sehingga menjadi penghalang yang menghambat penggunaan penjejak panas secara luas.
5.  Sidik Jari (Fingerprint)
Sidik jari berupa pola bukit dan lembah pada permukaan suatu ujung jari yang sering disebut minusi (minutiae), yang mana pembentukannya ditentukan sepanjang tujuh bulan yang pertama dari perkembangan janin. Sidik jari dari kembar identik adalah unik sehingga dengan demikian pola ujung jari setiap orang berbeda-beda. Harga scanner untuk melakukan akuisisi data sidik jari cukup murah. Ketelitian dari sistem pengenalan dengan sidik jari sekarang ini sudah cukup bagi sistem verifikasi skala kecil sampai menengah dan untuk sistem identifikasi yang menyertakan beberapa ratus pengguna. Gabungan beberapa sidik jari dapat menyediakan informasi tambahan yang memungkinkan untuk digunakan dalam pengenalan diri dalam skala besar. Ada beberapa permasalahan yang muncul pada sistem pengenalan diri dengan menggunakan sidik jari. Pertama, membutuhkan sumber daya komputasi yang besar terutama bila digunakan untuk sistem identifikasi. Kedua, Karena pengaruh usia, pekerjaan (pekerja fisik), luka, dan lain sebagainya, sidik jari seseorang dapat menjadi tidak jelas. Sulit untuk memperoleh ciri minusi dari sidik jari yang kurang/tidak jelas. Permasalahan yang terakhir, saat akuisisi data sidik jari menyentuh sensor.
Sisa tekanan sidik jari biasanya masih menempel pada sensor, sehingga dapat mengganggu proses akuisisi berikutnya.
Gaya berjalan seseorang adalah cara yang ganjil dalam berjalan seseorang dan merupakan biometrika spatio-temporal. Gaya berjalan tidaklah sangat membedakan, tetapi cukup bersifat membedakan untuk keperluan verifikasi dalam beberapa aplikasi dengan tingkat keamanan yang rendah. Gaya berjalan adalah suatu biometrika tingkah laku dan bisa jadi tidak terus sama, terutama dalam suatu periode waktu, dalam kaitan dengan fluktuasi berat badan, luka-luka yang menyangkut sambungan atau otak. Memperoleh gaya berjalan seseorang adalah serupa dengan memperoleh suatu gambaran wajah dan karenanya mungkin menjadi biometrika yang bisa diterima. Karena sistem yang berbasis orang yang berjalan menggunakan serangkaian video panjang untuk mengukur gaya bergerak dari masing-masing orang yang berjalan, maka masukannya adalah intensif dan secara komputasional cukup mahal.

Sistem pengenalan dengan geometri tangan didasarkan pada sejumlah pengukuran dari tangan manusia, termasuk bentuk, ukuran telapak tangan, serta lebar dan panjang jari. Sistem verifikasi berbasis geometri tangan telah banyak digunakan. Tekniknya sangat sederhana, relatif mudah untuk digunakan, dan murah. Faktor-faktor seperti cuaca kering dan kulit kering tidak akan mempengaruhi ketelitian sistem verifikasi berbasis geometri tangan. Geometri tangan tidak sangat unik sehingga tidak dapat dikembangkan untuk sistem identifikasi. Lebih lanjut, informasi geometri tangan mungkin tidak sama sepanjang periode pertumbuhan anak-anak. Sebagai tambahan, barang barang perhiasan perorangan (misal: cincin), menjadi tantangan tersendiri dalam memperoleh ciri geometri tangan yang benar. Alat untuk akuisisi data geometri tangan memiliki ukuran besar, dan  tidak bisa dipasang di dalam alat tertentu seperti laptop.
Terdapat sistem verifikasi yang hanya menggunakan sedikit jari (khususnya, jari tengah dan telunjuk) sebagai ganti dari keseluruhan tangan. Alat ini lebih kecil dibandingkan jika menggunakan seluruh geometri tangan, tetapi masih lebih besar dari yang digunakan dalam beberapa biometrika lainnya seperti: sidik jari, wajah, suara.
Selaput pelangi adalah daerah berbentuk gelang pada mata yang dibatasi oleh pupil dan sclera (bagian putih dari mata). Tekstur visual dari selaput pelangi dibentuk selama perkembangan janin dan menstabilkan diri sepanjang dua tahun pertama dari kehidupan janin. Tekstur selaput pelangi yang kompleks membawa informasi sangat unik dan bermanfaat untuk pengenalan pribadi. Kecepatan dan ketelitian dari sistem pengenalan berbasis iris sangat menjanjikan dan sangat memungkinkan untuk digunakan pada sistem identifikasi berskala besar. Masing-masing selaput pelangi adalah unik dan seperti sidik jari, tekstur selaput pelangi dari kembar identik adalah berbeda. Tekstur dari selaput pelangi sangat sulit untuk dirusak melalui pembedahan. Kelemahan dari pengenalan dengan selaput pelangi adalah alat untuk akuisisi data relatif mahal, karena alat akuisisi harus menjamin kenyamanan pengguna dalam memakainya.
Setiap orang mengetik pada keyboard dengan karakteristik tertentu dapat dianggap sebagai suatu biometrika. Tingkah laku ini tidak begitu unik akan tetapi hal ini menawarkan informasi yang cukup untuk verifikasi identitas. Dinamika tombol adalah suatu biometrika tingkah laku, yang untuk beberapa individu, bisa diamati adanya berbagai variasi di dalam pola pengetikan. Lebih lanjut, cara penekanan tombol oleh seseorang bisa dimonitor dengan mudah ketika orang itu sedang mengetikkan informasi.
Telah diketahui bahwa masing-masing obyek memancarkan suatu bau yang merupakan karakteristik tentang  komposisi kimianya dan ini bisa digunakan untuk pembeda berbagai objek. Suatu bau atau kepulan udara yang melingkupi suatu obyek dapat diterima oleh suatu larik sensor bahan kimia, masing-masing sensitif kepada suatu kelompok berbau tertentu. Suatu komponen yang menyangkut bau yang dipancarkan oleh suatu badan manusia dapat membedakan individu tertentu . Masih belum diketahui apakah bau badan bisa dideteksi di samping bau obat penghilang bau badan dan komposisi kimia yang bermacam-macam  melingkupi lingkungan.
Telapak tangan dari tangan manusia berisi banyak pola bukit dan lembah seperti sidik jari. Area telapak tangan adalah jauh lebih besar dari area suatu jari dan sebagai hasilnya, telapak tangan diharapkan menjadi lebih membedakan lagi  dibanding sidik jari. Karena alat pemindai telapak tangan harus menangkap suatu area besar, mereka lebih besar dan lebih mahal dibanding sensor sidik jari. Telapak tangan manusia juga berisi fitur tambahan seperti garis utama dan kerutan yang dapat ditangkap oleh suatu alat pemindai dengan resolusi yang lebih rendah, yang mana akan bersifat lebih murah. Akhirnya, ketika menggunakan suatu scanner telapak tangan dengan resolusi tinggi, semua fitur seperti geometri tangan, fitur bukit dan lembah (misalnya, rincian yang tidak penting dan bentuk tunggal seperti delta), bentuk utama dan kerutan dapat dikombinasikan untuk membangun suatu sistem biometrika yang sangat akurat.
Pembuluh darah selaput jala kaya akan struktur dan merupakan suatu karakteristik unik dari individu. Selaput jala diklaim menjadi biometrika yang paling menjamin karena tidak mudah untuk berubah.
Untuk mendapatkan citra selaput jala, seseorang harus mengintip ke dalam suatu sensor dan memfokuskan pada suatu noda khusus di dalam bidang tertentu sehingga diperoleh bagian dari pembuluh selaput jala yang ditentukan. Akuisisi citra selaput jala membutuhkan kerjasama dari subjek dan memerlukan kontak dengan lensa mata. Semua faktor ini berpengaruh kurang baik bagi penerimaan masyarakat terhadap biometrika selaput jala. Pembuluh selaput jala dapat mengungkapkan beberapa kondisi-kondisi medis, seperti hipertensi, yang merupakan faktor lain yang menghalangi penerimaan masyarakat terhadap biometrika berbasis selaput jala.
Tanda tangan seseorang dikenal sebagai suatu karakteristik individu itu. Walaupun tanda tangan memerlukan kontak dengan instrumen penulisan dan suatu usaha pada pihak pemakai, mereka telah diterima di dalam pemerintahan, sah menurut undang-undang, sebagai metoda verifikasi dalam transaksi. Tanda tangan adalah suatu biometrika tingkah laku yang dapat berubah pada masa waktu tertentu dan dipengaruhi oleh fisik dan kondisi-kondisi emosional dari orang menandatangani. Tanda tangan sebagian orang pada hakekatnya bertukar-tukar, bahkan kesan berurutan dari tanda tangan mereka berbeda. Lebih lanjut, pemalsu profesional mampu mereproduksi tanda tangan yang dapat mengelabui sistem.
Deoxyribo Nucleic Acid (DNA) merupakan kode yang unik untuk ciri khas seseorang, kecuali dengan adanya fakta bahwa kembar identik mempunyai pola DNA yang sama. Bagaimanapun juga sekarang ini DNA kebanyakan digunakan dalam konteks aplikasi forensik untuk pengenalan seseorang (Darma Putra, 2009).  
Tiga permasalahan yang membatasi kegunaan dari biometrika ini untuk aplikasi lain :
·                     Kepekaan dan pencemaran : kode DNA mudah dicuri dari suatu subyek tanpa menarik suatu kecurigaan dan kemudian disalahgunakan untuk suatu tujuan tertentu.
·                     Masalah pengenalan real time : teknologi yang ada saat ini untuk DNA memerlukan metoda bahan kimia yang sulit (proses basah) dan memerlukan keterampilan ahli sehingga tidaklah cocok untuk pengenalan secara online.
·                     Perlindungan privasi : informasi tentang penyakit seseorang bisa diperoleh dari pola DNA dan penyalahgunaan dari informasi ini dapat mengakibatkan diskriminasi.
Pengenalan menggunakan biometrika gigi sangat berperan ketika terjadi bencana hebat seperti bom dan kecelakaan pesawat, yang sering kali disertai kerusakan hebat dan kebakaran. Wajah, sidik jari, telapak tangan, kartu identitas sulit untuk digunakan untuk mengenali korban karena kemungkinan besar mengalami kerusakan berat. Pada kondisi ini gigi dapat digunakan untuk mengenali korban.
Kelayakan suatu teknik biometrika spesifik tergantung pada kebutuhan dari domain aplikasi. Tidak ada teknik tunggal yang melebihi kemampuan yang lainnya dalam semua lingkungan operasional. Dalam hal ini, masing-masing teknik biometrika adalah dapat diterima dan tidak ada karakteristik biometrika yang optimal untuk semua keadaan. Sebagai contoh, sungguh diketahui bahwa kedua teknik berbasis iris dan yang berbasis sidik jari lebih akurat dibanding teknik yang berbasis suara.
Suatu perbandingan ringkas pada teknik biometrika berdasarkan pada tujuh faktor yang ditampilkan pada Tabel 2.1. Contoh lain misalkan biometrika DNA. Meskipun alat akuisisinya jauh lebih mahal  dibandingkan biometrika lainnya seperti sidik jari, wajah, suara, atau yang lainnya, akan tetapi untuk mengetahui hubungan kekerabatan atau kekeluargaan seseorang maka mau tidak mau harus menggunakan DNA, karena biometrika yang lainnya tidak dapat digunakan dalam kasus ini, akan tetapi bila digunakan untuk membedakan orang kembar, maka sidik jari lebih cocok, karena sidik jari orang kembar adalah berbeda, sedangkan DNA dari orang kembar memiliki pola yang sama.
  Tabel 2.1 Perbandingan berbagai teknologi biometrika (Goananta Wangsa, 2008)


Keterangan : Tinggi, Medium,dan Rendah berturut-turut ditandai oleh T, M, dan R.



Penerapan sistem biometrika dapat dikelompokkan pada 3 kelompok aplikasi, antara lain :
1.      Aplikasi komersial, seperti proses login komputer jaringan, sistem keamanan data elektronik, e-commerce, e-banking, akses Internet, ATM, kartu kredit, kontrol akses pada fasilitas fisik, telpon selular, PDA, manajemen data kesehatan (rekam medis), pendidikan jarak jauh, dan lain-lain.
2.      Aplikasi pemerintahan, yaitu KTP, SIM, jaminan sosial, pengawasan  perbatasan, pengawasan pembuatan paspor.
3.       Aplikasi forensik, misalnya investigasi kriminal, identifikasi teroris, dan penentuan hubungan kekerabatan atau kekeluargaan.

*file dapat di dowload DISINI 

Comments

  1. bang itu dalam verifikasi suara menggunakan software PRAAT kira-kira metodenya bagaimana ya?apa yang dijelaskan diatas itu pake program PRAAT?
    btw salam kenal ya dari mahasiswa teknik fisika ITB

    ReplyDelete
    Replies
    1. sory bru sempt cek blog lg gan....sy gk pake program PRAAT gan....cuma pake metode MFCC dan DTW ditulis pake c#.

      salama kenal jg y.

      Delete
    2. Buku apa yang membahas metode MFFCC ?

      Delete
    3. untuk materi mfcc dulu sy pakai literatur dari internet aja.

      Delete
  2. kang link untuk yang ini ko udh ga ada ya filenya,,saya tertarik untuk mempelajari metoda ini,,soalnya literature yg b.indonesia msh jarang bgt,,trims

    ReplyDelete
    Replies
    1. wah..ziddu itu main hapus saja ya. sabar bang nanti saya cb cari² lagi arsipnya di gudang...

      Delete
  3. bole saya minta sourcecode nya? sangat perlu makasih

    ReplyDelete
  4. maaf mas, kalo boleh saya minta file lengkapnya dong, soalnya saya lagi butuh banget referensi tetang bab itu. untuk penelitian saya. terimakasih

    ReplyDelete

Post a Comment

silahkan berkomentar, kritik dan saran yang membangun adalah harapkan kita semua !

Popular posts from this blog

flexigrid + php with add and edit button

Data Flow Diagram (DFD)