Create successful ePaper yourself
Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.
dolu, sağ sınıftakilerin ise boş olmasıdır. Şekillerin<br />
büyüklük, şeklin türü, konumu gibi farklı <strong>temsil</strong>lerinin bir<br />
önemi yoktur. 5 nolu problemde ise sınıflar şekillerin düz<br />
ya da eğri çizgilerden oluşmasıyla birbirinden<br />
ayrılmaktadır. Şekillerin diğer tür <strong>temsil</strong>lerinin bir önemi<br />
yoktur.<br />
Örneklerden görüldüğü gibi Bongard problemleri<br />
şekillerin nasıl <strong>temsil</strong> edildiğinin anlaşılmasını<br />
gerektirmektedir. Dolayısıyla bu problemler, bir şeklin çok<br />
sayıda olası <strong>temsil</strong>inden doğru (sınıfları ayıran) olanının<br />
hangisi olduğunun bulunması olarak diğer bir ifade ile<br />
<strong>temsil</strong> öğrenme olarak tanımlanabilir [4].<br />
Sunulan bu çalışmada, <strong>temsil</strong> öğrenmenin bir makine<br />
tarafından yapılabildiğinin testi için, makine öğrenmesi<br />
algoritmalarının bir sonraki hedefinin Bongard problemleri<br />
olabileceği önerilmektedir.<br />
Bildirinin devamında Bongard problemlerinin bu amaç<br />
için neden uygun olduğu açıklanacak ve yapılan denemeler<br />
sunulacaktır.<br />
II.<br />
KONVOLÜSYONEL SİNİR AĞLARI<br />
Şekil tanımada, klasik yapay sinir ağlarında alt parçalar<br />
yerine bütünün <strong>temsil</strong>ine odaklanılmaktadır.<br />
Konvolüsyonel ağlarda ise önce şekli oluşturan alt şekiller<br />
bulunmakta, ardından bunlar ileri seviyelerde<br />
birleşmektedirler [5].<br />
Şekil 2’de ağa bir yüz imgesi gelmekte, ilk aşamada<br />
basit şekillerin varlığını kontrol edilmekte, ilerleyen<br />
aşamalarda daha kompleks şekillerin (alt seviyedeki<br />
şekillerin birleşmesinden oluşan) varlığı kontrol<br />
edilmektedir.<br />
Şekil 2. Konvolüsyonel Sinir Ağlarıyla Kişi Tanıma [6]<br />
Bu mimariye gerekçe olarak, görsel verinin insanda<br />
işlenmesinin de benzeri bir mekanizmaya sahip olması<br />
verilmektedir. Tüm şekiller küçük şekillerin birleşiminden<br />
oluşur. Buna örnek olarak Şekil 3’te nesne tanıma için<br />
oluşturulan bir ağın en alt seviyesindeki şekillerin aynı<br />
olduğu, yukarılara çıkıldıkça farklı nesne sınıfları için<br />
şekillerin değiştiği görülmektedir.<br />
Şekil 3. Konvolüsyonel Sinir Ağlarıyla Nesne Tanıma [7]<br />
Şekil 4’te bu ağların genel yapısı sayı tanıma örneği<br />
üzerinde gösterilmiştir.<br />
Şekil 4. Konvolüsyonel Sinir Ağlarıyla Sayı Tanıma [8]<br />
Şekil 4’te görüldüğü üzere, ağda konvolüsyon, alt<br />
örnekleme (subsampling) ve klasik yapı (en son katman)<br />
bir aradadır. Konvolüsyon işleminde her bir birim<br />
kendinden önceki tüm birimlere bağlanmak yerine<br />
resimdeki bir bölgeye bağlanır, bu bölgede kendini arar.<br />
Kendini bulup bulamadığını bir sonraki katmana iletir. Alt<br />
örneklemede ise yine birim sadece bir bölgeye odaklanır ve<br />
buradan aldığı sinyalleri ortalama almak ya da<br />
maksimumunu almak gibi bir işlemden geçirerek sonraki<br />
katmana iletir. Bu işlemin amacı, bir şeklin çeşitli<br />
kaymalarına karşı yine de tanınabilmesini sağlamaktır.<br />
Bu tür mimariler, son zamanlarda popülerlik kazanmış,<br />
üzerlerine akademik birçok çalışma yapılmış ve ticari<br />
uygulamalarda kullanılmaya başlanmıştır.<br />
III.<br />
NEDEN BONGARD PROBLEMLERİ<br />
Bongard problemleri mevcutta insan zekasını<br />
derecelendirmek için de kullanılabilmekte, henüz<br />
makineler tarafından çözülememektedirler [9, 10]. Şekil<br />
5’teki problemler incelendiğinde, bunların makinelerce<br />
çözülebilmesinin ne denli zor olduğu görülebilir.