13.07.2015 Views

07 31 Ocak - 2 Şubat 2007 Kütahya - Akademik Bilişim Konferansları

07 31 Ocak - 2 Şubat 2007 Kütahya - Akademik Bilişim Konferansları

07 31 Ocak - 2 Şubat 2007 Kütahya - Akademik Bilişim Konferansları

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

Çok Katmanlı Algılayıcı ve Geriye Yayılım Algoritması ile Konuşmacı Ayırt Etmeİsmail Aybars Moralı, Fırat Fehmi AygünMetin bağımlı yöntemlerde sistem söylenenkelimeyi bilir ve konuşmacıyı bulur. Metin bağımsızyöntemde ise sistem konuşmacıyı herhangibir metinden bulmak zorundadır ki buda konuşmacının ayırt edilebilmek için belirlibirkaç kelimeyi ya da tümceyi söylemesi zorunluluğununortadan kalkması demektir.Şekil 1: Konuşmacı Tanımanın Sınıflandırılması [2]2. Kapalı Küme Konuşmacı Ayırt EtmeTüm desen tanıma işlemleri gibi konuşmacıayırt etmede de dört ana adım bulunmaktadır(Şekil 2).Şekil 2 : Konuşmacı Ayırt Etme SistemiÖznitelik Çıkarma: Kaydedilen tüm ses örneklerininboyutlarının birbirinden farklı olmasınedeniyle tüm örneklerin aynı boyutta temsiledilmesi gerekmektedir. Aynı zamanda bazen,ses dosyalarının boyutu, işlenebilmesi için olmasıgerekenden daha büyük boyutta veyaiçerikleri pek çok önemsiz veri taşıyor olabilir.Bu sebep ile ses dosyalarını standart hale getirebilmekiçin her bölümde bir öznitelik çıkartmaişlemine ihtiyacımız vardır. Öznitelik çıkartmaişlemi ses dosyasından işe yarayan ve istenilenözelliklerinin tespit edilmesini ve onların aynıözellik sayısı ile temsil edilmesini sağlar. Öznitelikçıkartma işlemi konuşmacıların konuşmastilleri arasındaki analitik farkı belirtmelidir. Dışseslerin konuşmalardan ayrılması da mühimdir.Bu tespit edilen özellikler daha sonra konuşmacılarınkonuşma özellikleri ile karşılaştırılır.Çok farklı öznitelik tespit algoritmaları bulunmaktadır.Mel-Frequency Cepstrum Katsayıları(MFCC), lineer tahminlenebilir kodlama (LPC)(autoregressive modelleme veya AR modellemeolarak da bilinir) konuşmacı tanıma problemlerindekonuşma sinyal özelliklerinin ayırt edilmesindekullanılan iki yaygın algoritmadır [2], [4].Konuşmacı Modelleme (Eğitim): Bu adımkonuşmacıları konuşma sinyal özniteliklerinegöre modellemeyle uğraşır. Amaç konuşmacınınsesini eğitimde kullanılacak örneklere göregenelleştirmektir. Diğer bir deyişle görünmeyenyöneyler düzgünce sınıflandırılabilir.Konuşma Örnekleri Toplama: Konuşmacıveritabanını oluşturmak için kaydedilmiş olankonuşma örneklerinin toplanmasıdır. Bu bölümaçıkçası basit gözükmektedir çünkü tek gereksinimkaliteli ve temiz kayıt ortamıdır.Fakat, eğer problem konuşmalardan bağımsızolacak ise verilmesi gereken bazı kararlarbulunmaktadır. Konuşulan dilin karakteristiközelliklerinden konuşmacının etkilenmemesiiçin seslendirilecek kelimeler ve cümleciklerözenle seçilmelidir. Türkçe için biz bir örnekkümesi kararlaştırdık.58Konuşmacı tanıma sistemlerinde Bayes öğrenmesive karar ağaçları kullanılabilir. Eğer Bayesöğrenmesine uygun veri kümesi sağlanabilirseyüksek sınıflandırma oranlarına erişilinebilir.Bayes’te öğrenme zamanı yoktur, yanisınıflandırmadan önce de bir başlangıç zamanıgerekmez. Fakat Bayes öğrenmesi her sınıflandırmaiçin tüm veri kümesini işler. Dolayısıylabu yöntemin ana dezavantajı test verisininuzun işlem zamanıdır. Bayes yöntemi şifrekontrolü ve sahip tanıma uygulamarında kullanılabiliramabüyük veritabanlarında arama vesınıflandırmada büyük miktarda zaman harcarlar[3]. Amacımız Napster gibi programlar için

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!