temsil_ogrenme_UBMK2016_v2

More documents

Recommendations

Info

dolu, sağ sınıftakilerin ise boş olmasıdır. Şekillerin büyüklük, şeklin türü, konumu gibi farklı temsillerinin bir önemi yoktur. 5 nolu problemde ise sınıflar şekillerin düz ya da eğri çizgilerden oluşmasıyla birbirinden ayrılmaktadır. Şekillerin diğer tür temsillerinin bir önemi yoktur. Örneklerden görüldüğü gibi Bongard problemleri şekillerin nasıl temsil edildiğinin anlaşılmasını gerektirmektedir. Dolayısıyla bu problemler, bir şeklin çok sayıda olası temsilinden doğru (sınıfları ayıran) olanının hangisi olduğunun bulunması olarak diğer bir ifade ile temsil öğrenme olarak tanımlanabilir [4]. Sunulan bu çalışmada, temsil öğrenmenin bir makine tarafından yapılabildiğinin testi için, makine öğrenmesi algoritmalarının bir sonraki hedefinin Bongard problemleri olabileceği önerilmektedir. Bildirinin devamında Bongard problemlerinin bu amaç için neden uygun olduğu açıklanacak ve yapılan denemeler sunulacaktır. II. KONVOLÜSYONEL SİNİR AĞLARI Şekil tanımada, klasik yapay sinir ağlarında alt parçalar yerine bütünün temsiline odaklanılmaktadır. Konvolüsyonel ağlarda ise önce şekli oluşturan alt şekiller bulunmakta, ardından bunlar ileri seviyelerde birleşmektedirler [5]. Şekil 2’de ağa bir yüz imgesi gelmekte, ilk aşamada basit şekillerin varlığını kontrol edilmekte, ilerleyen aşamalarda daha kompleks şekillerin (alt seviyedeki şekillerin birleşmesinden oluşan) varlığı kontrol edilmektedir. Şekil 2. Konvolüsyonel Sinir Ağlarıyla Kişi Tanıma [6] Bu mimariye gerekçe olarak, görsel verinin insanda işlenmesinin de benzeri bir mekanizmaya sahip olması verilmektedir. Tüm şekiller küçük şekillerin birleşiminden oluşur. Buna örnek olarak Şekil 3’te nesne tanıma için oluşturulan bir ağın en alt seviyesindeki şekillerin aynı olduğu, yukarılara çıkıldıkça farklı nesne sınıfları için şekillerin değiştiği görülmektedir. Şekil 3. Konvolüsyonel Sinir Ağlarıyla Nesne Tanıma [7] Şekil 4’te bu ağların genel yapısı sayı tanıma örneği üzerinde gösterilmiştir. Şekil 4. Konvolüsyonel Sinir Ağlarıyla Sayı Tanıma [8] Şekil 4’te görüldüğü üzere, ağda konvolüsyon, alt örnekleme (subsampling) ve klasik yapı (en son katman) bir aradadır. Konvolüsyon işleminde her bir birim kendinden önceki tüm birimlere bağlanmak yerine resimdeki bir bölgeye bağlanır, bu bölgede kendini arar. Kendini bulup bulamadığını bir sonraki katmana iletir. Alt örneklemede ise yine birim sadece bir bölgeye odaklanır ve buradan aldığı sinyalleri ortalama almak ya da maksimumunu almak gibi bir işlemden geçirerek sonraki katmana iletir. Bu işlemin amacı, bir şeklin çeşitli kaymalarına karşı yine de tanınabilmesini sağlamaktır. Bu tür mimariler, son zamanlarda popülerlik kazanmış, üzerlerine akademik birçok çalışma yapılmış ve ticari uygulamalarda kullanılmaya başlanmıştır. III. NEDEN BONGARD PROBLEMLERİ Bongard problemleri mevcutta insan zekasını derecelendirmek için de kullanılabilmekte, henüz makineler tarafından çözülememektedirler [9, 10]. Şekil 5’teki problemler incelendiğinde, bunların makinelerce çözülebilmesinin ne denli zor olduğu görülebilir.
tanınabilir, konumları bulunabilir. Ancak sınıfların, elipslerin gösterdiği yönlerdeki şeklin ne olduğuna (sol sınıfta çarpı, sağ sınıfta daire) göre ayrıldığının bulunması için nasıl bir mimari gerektiği henüz bilinmemektedir. IV. MEVCUT MİMARİLER NELER YAPABİLİR / NELER YAPAMAZ? İki katmana sahip klasik yapay sinir ağları gizli katmandaki birim sayısının sonsuza gidişiyle herhangi bir eğitim setini öğrenebilir [11]. Aslında, gizli katmandaki birim sayısının eğitim setindeki örnek sayısına eşit olması durumunda, her bir birim bir eğitim örneğine karşılık gelir ve tüm örnekler için eğitim setindeki çıkış elde edilebilir. Gizli katmanı giriş katmanına bağlayan ağırlıklarda şekiller depolanır. Klasik ağlarda bu birimler tüm resme bağlı iken, konvolüsyonel ağlarda resmin bir kısmına bağlıdır. Bu bölümün devamında Bongard problemlerinin en alt seviyesindeki bazı temsilleri öğrenmede klasik ağlar ve konvolüsyonel ağlar karşılaştırılacaktır. A. Yatay Dikey Çizgi Ayırma Klasik ağların dikey bir çizgiyi, yatay bir çizgiden ayırıp ayıramayacağını görmek için bir deney tasarlanmıştır. Bu problem bir Bongard problemi olarak Şekil 6’daki gibi ifade edilebilir. Şekil 5. 64 ve 62 nolu Bongard Problemleri Günümüzde nesne tanıma yarışmalarında kullanılan veri kümelerinde çok sayıda sınıfa ait çok sayıda örnek yer almaktadır. Farklı sınıfların örnekleri alt seviyelerde benzer şekillerden oluşmakta, üst seviyelerde bu şekiller farklılaşmaktadır. Yüzlerce farklı nesne sınıfının tanınmasının bu yolla mümkün olduğu yarışma sonuçlarından görülmektedir [2]. Bongard problemlerindeki örnekler de ikili resimler halinde yapay öğrenme algoritmalarına kolaylıkla verilebilir. Orijinal problemler 2 sınıflı veri kümeleri olarak düşünülebilir. Eğitim ve test örnekleri olarak orijinal veriler ya da orijinal kümeyle aynı mantıkla oluşturulmuş yapay örnekler kullanılabilir. Problemlerin çözümünü ifade eden sınıflar arası farklılıklar hiyerarşik olarak alt seviyedeki şekillerin birleşimi olarak elde edilebilir. Örneğin noktalar birleşerek çizgileri, çizgiler birleşerek şekilleri üretebilirler. Dolayısıyla, hiyerarşik mimarilerin örnekleri oluşturan şekillerin tanınması ve çeşitli özelliklerinin (yer, doğrultu, doku vb.) belirlenmesi için kullanımı mümkün görünmektedir. Ancak örnekleri oluşturan şekillerin çeşitli katmanlarda çeşitli temsilleri oluşturulduktan sonra bunların nasıl birleştirileceği, hangilerinin sınıfları birbirinden ayırdığı problemi ortada durmaktadır. Burada mevcut mimarilerde yapıldığı gibi sadece alt seviye şekillerin birleşip yeni şekiller üretmenin yetmeyeceği açıktır. Örneğin 64 nolu problemde mevcut mimarilerle, noktalardan yola çıkılarak elipsler, çarpılar, daireler Şekil 6. Yatay ve dikey çizgileri ayırmanın bir Bongard problemi olarak temsili 15*15’lik ikili resimler üzerine rastgele uzunluklarda dikey ya da yatay 32 çizgi çekilerek 2 sınıfa ait 32 örnek üretilmiştir. Şekil 7’de üretilen çizgilerin 15*15’lik resim üzerinde işgal ettikleri hücrelerin frekansları görülmektedir.
Page 1: Temsil Öğrenme için Bongard Prob
Page 5 and 6: Şekil 12. Nokta koordinatı bulma

temsil_ogrenme_UBMK2016_v2

Create successful ePaper yourself

Delete template?

Save as template?