13.07.2015 Views

07 31 Ocak - 2 Şubat 2007 Kütahya - Akademik Bilişim Konferansları

07 31 Ocak - 2 Şubat 2007 Kütahya - Akademik Bilişim Konferansları

07 31 Ocak - 2 Şubat 2007 Kütahya - Akademik Bilişim Konferansları

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

<strong>Akademik</strong> Bilişim’<strong>07</strong> - IX. <strong>Akademik</strong> Bilişim Konferansı Bildirileri<strong>31</strong> <strong>Ocak</strong> - 2 Şubat 20<strong>07</strong> Dumlupınar Üniversitesi, KütahyaTürkçe Bir Sözlükteki Tanımlardan Kavramlar ArasındakiÜst-Kavram İlişkilerinin ÇıkarılmasıOnur Güngör, Tunga GüngörBoğaziçi Üniversitesi, Bilgisayar Mühendisliği Bölümü, İstanbulonurgu@boun.edu.tr, gungort@boun.edu.trÖzet: Bu bildiride, bir sözlükteki sözcüklerin arasındaki anlamsal ilişkileri çıkaran ve hiyerarşikbir yapı oluşturan kural tabanlı bir yöntem sunulmaktadır. Yöntemdeki ana kurallar üç gruba ayrılabilir:sözcüğün yüzey biçimini kullanan kurallar, sözcüğün kategorisini kullanan kurallar vesözcüğün tanımını kullanan kurallar. Oluşturulan hiyerarşinin kök düğümleri, İngilizce WordNetveri tabanından alınmıştır. Üst-kavram çıkarma oranı yaklaşık %94 olarak tespit edilmiştir. Hiyerarşininiçeriği ve eksiklikleri tartışılmış, Türkçe WordNet ile karşılaştırılmıştır.Anahtar Kelimeler: Anlamsal ilişkiler, bilgisayarla işlenebilir sözlükler.Extracting Hypernymy Relations Between Concepts From The Definitions in a Turkish DictionaryAbstract: In this paper, we present a rule-based method in order to extract semantic relations betweenwords in a dictionary and build a hierarchical structure. The main rules used in the methodcan be divided into three groups: rules that use the surface form of the word, rules that use thecategory of the word, and rules that use the definition of the word. The root nodes of the hierarchybuilt were taken from English WordNet. The hypernym extraction ratio was observed around94%. The contents and the deficiencies of the hierarchy were discussed and it was compared withTurkish WordNet.Keywords: Semantic relations, machine-readable dictionaries.1. Giriş<strong>31</strong>Doğal dil işleme (DDİ) sistemleri, günümüzdeçoğunlukla metinleri biçim bilimsel (morphological)ve söz dizimsel (syntactic) açılardan analizetmekte, anlam bilimsel (semantical) özellikleridikkate almamaktadır. Anlam bilimselçıkarımların yapılabilmesi için, diğer kaynaklarailave olarak, dildeki sözcükler ve kavramlararasındaki anlamsal ilişkileri tutan bir veri tabanınaihtiyaç duyulmaktadır. Örneğin, bir bilgisayarlıçeviri (machine translation) sisteminin,kaynak dildeki bir sözcüğün hedef dildeki ikiolası anlamı arasında seçim yaparken, kavramlararasındaki kısıtlamaları dikkate alması sisteminbaşarısını arttırabilir. Bu duruma somut birörnek olarak, bir cümlenin söz dizimsel öğelerineayrıştırıldığı (parsing) ve cümlenin öznesinincanlı bir varlık olduğu düşünülsün. Çevirininyapılacağı dilde özneye karşılık gelen birdençok kavram mevcutsa, bu kavramlar arasındancanlı bir varlığı simgeleyenin seçilmesi gerekmektedir.Sistemin anlamsal ilişkileri kapsayanuygun bir veri tabanı tarafından desteklenmesidurumunda, veri tabanını sorgulayarak özneninolası anlamları arasından canlı nesne özelliğinesahip olanını seçmek mümkün olacaktır.Literatürde bu tür veri tabanlarını oluşturmakiçin çeşitli çalışmalar bulunmaktadır. Bu veritabanları içerisinde en bilineni, isim, fiil vesıfat kökenli sözcükler için eş anlam kümeleri(synonym set – synset) ve bunlar arasındakibazı anlamsal ilişkileri içeren WordNet’tir [1].

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!