13.07.2015 Views

07 31 Ocak - 2 Şubat 2007 Kütahya - Akademik Bilişim Konferansları

07 31 Ocak - 2 Şubat 2007 Kütahya - Akademik Bilişim Konferansları

07 31 Ocak - 2 Şubat 2007 Kütahya - Akademik Bilişim Konferansları

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

<strong>Akademik</strong> Bilişim’<strong>07</strong> - IX. <strong>Akademik</strong> Bilişim Konferansı Bildirileri<strong>31</strong> <strong>Ocak</strong> - 2 Şubat 20<strong>07</strong> Dumlupınar Üniversitesi, KütahyaÇok Katmanlı Algılayıcı ve Geriye Yayılım Algoritması ileKonuşmacı Ayırt Etmeİsmail Aybars Moralı, Fırat Fehmi AygünDokuz Eylül Üniversitesi, Bilgisayar Mühendisliği Bölümü, İzmirismail.morali@st.cs.deu.edu.tr, firat.aygun@st.cs.deu.edu.trÖzet: İnsan kulağının konuşmaların sahibini ve şarkı söyleyenleri ayırt etmesi gibi bilgisayar dabu ayrımları yapabilirler. Biz bu çalışmada konuşmacı ayırt etmenin detaylarını inceledik. Geriyeyayılım algoritması ve yapay sinir ağları ile verilen ses dosyasının konuşmacısının kim olduğunutespit etmeye çalıştık. Yapay sinir ağlarının eğitim aşamasından önce MFCC dönüşümü ile önemliayırt edici özellikleri bulduk. Eğitimden sonra, eğitim verilerini test verileri olarak verdik vetanıma oranının son ayarlarda %57.5 bulduk.Anahtar Kelimeler: Konuşmacı tanıma, yapay sinir ağları, geriye yayılım, MFCC.Identifying Speakers Using Multi Layer Perceptron Backpropagation AlgorithmAbstract: As the human ear and brain identifies speakers of the songs and speeches, the computerscan also identify the speakers. In this project, we have looked into the details of speaker identification.It has been aimed to identify the speaker of a given sound file based on the well knownbackpropagation neural network approach that was used to handle the training and identifyingprocess. Before training phase, the feature set of the training set of sound files were extracted byMFCC transformation. After training, we have given the training set as test set and found the successfulidentification is 57.5% with final configuration.Keywords: Speaker identification, neural network, backpropagation, MFCC.1. Girişİnsan sesi çeşitli bilgiler içerir. İsim vermek gerekirsesöylenen kelime, söyleme tonu, söyleyeninruh hali, söyleyenin cinsiyeti, kelimenindili, söyleyenin kimliği insan sesinden çıkartılabilir.Bu çalışma da Konuşmacı Tanıma’nın birparçası olan konuşmacıyı ayırt etmeyi sunar.Konuşmacı tanıma temel olarak iki başlığa ayrılır.Biri konuşmacı doğrulama, diğeri de konuşmacıayırt etmedir. Konuşmacı doğrulamakonuşanın sesinden kişinin kimliğini doğrulamaişidir. Bu süreç sadece iddia edilen kimlikhakkında ikili bir karara varmayı içerir.Aynı şekilde konuşmacı ayırt etme de iki anabaşlığa ayrılabilir. Bunlar açık küme ve kapalıküme konuşmacı ayırt etmedir.Açık küme ayırt etmede amaç, sahibi belli olmayanses örneğinin hangi kayıtlı konuşmacıyaait olduğunu bulmak veya sesin kimseyeait olmadığını söylemektir. Kapalı küme ayırtetmede ise amaç en çok eşleşen konuşmacıyıbulmaktır [2]. Bu iki yöntem arasındaki tekfark, kapalı küme yöntemi mutlaka bir sonuçdöndürür fakat açık küme yöntemi bilinmeyenkonuşmacı sonucunu verebilir. Bu çalışmadakapalı küme konuşmacı ayırt etme ele alınmıştır.Kapalı küme konuşmacı ayırt etme de ikidala ayrılır – metin bağımlı ve metin bağımsız.57

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!