D - Süleyman Demirel Üniversitesi
D - Süleyman Demirel Üniversitesi
D - Süleyman Demirel Üniversitesi
You also want an ePaper? Increase the reach of your titles
YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.
T.C.<br />
SÜLEYMAN DEMİREL ÜNİVERSİTESİ<br />
FEN BİLİMLERİ ENSTİTÜSÜ<br />
GERÇEK ZAMANLI TAŞIT PLAKA TANIMA SİSTEMİ<br />
HALİME BOZTOPRAK<br />
Danışman: Prof.Dr. Mustafa MERDAN<br />
YÜKSEK LİSANS TEZİ<br />
ELEKTRONİK ve HABERLEŞME<br />
MÜHENDİSLİĞİ ANABİLİMDALI<br />
ISPARTA – 2007
Fen Bilimleri Enstitüsü Müdürlüğüne<br />
Bu çalışma jürimiz tarafından ELEKTRONİK HABERLEŞME ANABİLİM<br />
DALI'nda oybirliği/oyçokluğu ile YÜKSEK LİSANS TEZİ olarak kabul edilmiştir.<br />
Başkan : Prof.Dr.Mustafa MERDAN (İmza)<br />
SDU Müh.Mim.Fak.Elekt.ve Hab.Müh.Bölümü<br />
Üye : Yrd.Doç.Dr.Bayram CETİŞLİ (İmza)<br />
SDU Müh.Mim.Fak.Bilgisayar Müh.Bölümü<br />
Üye : Yrd.Doç.Dr.Mesud KAHRİMAN (İmza)<br />
SDU Müh.Mim.Fak.Elekt.ve Hab.Müh.Bölümü<br />
ONAY<br />
Bu tez 22/11/2007 tarihinde yapılan tez savunma sınavı sonucunda, yukarıdaki jüri<br />
üyeleri tarafından kabul edilmiştir.<br />
1<br />
Prof. Dr. Fatma GÖKTEPE<br />
Enstitü Müdürü
İÇİNDEKİLER<br />
2<br />
Sayfa<br />
İÇİNDEKİLER......................................................................................................... i<br />
ÖZET ..................................................................................................................... iii<br />
ABSTRACT............................................................................................................vi<br />
TEŞEKKÜR .............................................................................................................v<br />
ŞEKİLLER DİZİNİ .................................................................................................vi<br />
ÇİZELGELER DİZİNİ ......................................................................................... viii<br />
SİMGELER VE KISALTMALAR DİZİNİ..............................................................ix<br />
1. GİRİŞ ............................................................................................................11<br />
2. KURAMSAL TEMELLER............................................................................15<br />
2.1.1 Gerçek renk-gri skala dönüşümü .................................................................15<br />
2.1.2 Eşikleme .....................................................................................................15<br />
2.1.2.1 Otsu Eşik Belirleme Yöntemi ...................................................................16<br />
2.2. Geometrik Dönüşümler ..................................................................................18<br />
2.3. Bölgelerin Etiketlenmesi ................................................................................19<br />
2.4. Morfolojik İşlemler ........................................................................................20<br />
2.5. Top-Hat Dönüşümü........................................................................................25<br />
2.6. Hough Dönüşümü ..........................................................................................27<br />
2.7. Karakter Tanıma ............................................................................................30<br />
2.7.1 Karakter Tanıma Ön İşlemler ......................................................................30<br />
2.7.1.1 Eşikleme ..................................................................................................31<br />
2.7.1.2 İnceltme ...................................................................................................31<br />
2.7.1.3 Onarım .....................................................................................................32<br />
2.7.1.4 Normalleştirme.........................................................................................32<br />
2.7.2 Korelasyon ile Karakter Tanıma..................................................................32<br />
2.7.3 Destek Vektör Makineleri Ve Öğrenme Metodolojisi ..................................33
2.7.3.1 Lineer Öğrenme Makineleri......................................................................33<br />
2.7.3.1.1 Lineer Sınıflandırma..............................................................................33<br />
2.7.3.1.2 Kernel Tabanlı Özellik Uzayı ................................................................35<br />
2.7.3.1.3 Özellik Uzayları ve Kerneller ................................................................35<br />
2.7.3.1.4 Özellik Uzayında Öğrenme....................................................................36<br />
2.7.3.1.5 Vapnik ve Chervonenkis (VC) Teorisi ve VC Boyutu............................37<br />
2.7.3.1.6 Langrangian Teorisi...............................................................................38<br />
2.7.3.2 Destek Vektör Makineleri (Support Vector Machines).............................39<br />
2.7.3.2.1 En Büyük Sınırlı Sınıflandırma ve Lineer Destek Vektör Makineleri.....40<br />
2.7.3.2.2 Lineer Ayırt Edilebilir Sınıflar...............................................................41<br />
2.7.3.2.3 Lineer Olarak Ayırt Edilemeyen Sınıflar ...............................................43<br />
2.7.3.2.4 Nonlineer Destek Vektör Makineleri Sınıflandırıcıları...........................44<br />
2.7.3.2.5 Çok Sınıflı Sınıflandırma.......................................................................46<br />
2.7.3.2.6 Bire-karşı-biri Metodu...........................................................................47<br />
2.7.3.2.7 Bire-karşı-diğerleri Metodu ...................................................................47<br />
3. MATERYAL VE YÖNTEM..........................................................................48<br />
3.1. Plaka Bölgesinin Bulunması...........................................................................48<br />
3.1.1 Bölgelerin Etiketlenmesi .............................................................................51<br />
3.1.2 Aday Plaka Bölgelerin Sağlaması Gereken Koşullar....................................52<br />
3.1.3 Plaka Bölgesinin Yatayla Paralel Hale Getirilmesi ......................................54<br />
3.1.4 Plaka Çerçevesinin Çıkarılması ...................................................................56<br />
3.2. Karakterlerin Ayrıştırılması............................................................................58<br />
3.2.1 Plakanın Normalize Edilmesi ......................................................................58<br />
3.3. Karakterlerin Tanınması.................................................................................61<br />
4. ARAŞTIRMA BULGULARI VE TARTIŞMA..............................................63<br />
5. SONUÇLAR..................................................................................................67<br />
6. KAYNAKLAR ..............................................................................................69<br />
ÖZGEÇMİŞ............................................................................................................70<br />
3
ÖZET<br />
Yüksek Lisans Tezi<br />
GERÇEK ZAMANLI TAŞIT PLAKA TANIMA SİSTEMİ<br />
Halime BOZTOPRAK<br />
<strong>Süleyman</strong> <strong>Demirel</strong> <strong>Üniversitesi</strong> Fen Bilimleri Enstitüsü<br />
Elektronik-Haberleşme Anabilim Dalı<br />
Plaka tanıma sistemleri araç tanıma otomasyonunda kullanılan tekniklerden biridir.<br />
Trafik denetleme, giriş otomasyonu ve denetimli saha giriş kontrolü uygulamalarında<br />
verimli olarak kullanılırlar.<br />
Bu çalışmada, Türk araç plakaları için plaka tanıma sistemi geliştirilmiştir. Tanıma<br />
işlemi üç aşamada gerçekleştirilmiştir; plaka bölgesinin bulunması, karakterlerin<br />
ayrıştırılması ve karakterlerin tanınması. Plaka bölgesinin bulunmasında, plaka<br />
olamayacak bölgeleri bastıran, plaka bölgesi olabilecek bölgeleri ön plana çıkartan<br />
top-hat dönüşümü kullanılmıştır. Bu dönüşümle plaka bölgesini kolaylıkla belirgin<br />
haline getirilerek doldurma işlemi ile de plakayı içeren bölge tespit edilir. Karakter<br />
ayrıştırma işlemi için yatay ve dikey izdüşümlerinden faydalanılmıştır ve Ayrıştırılan<br />
karakterler, destek vektör makineleri kullanılarak tanımlanmıştır. Ayrıca, kamera<br />
görüş açısından dolayı plaka bölgesi dikdörtgeninde meydana gelen bozulmalarda<br />
düzeltilmeye çalışılmıştır.<br />
Çalışmada plaka bölgesinin bulunması için %98, karakter ayrıştırma ve tanıma için<br />
%91 doğruluk oranlarına ulaşılmıştır.<br />
Anahtar Kelimeler: Plaka tanıma, morfolojik işlemler, top-hat dönüşümü, karakter<br />
tanıma, destek vektör makineleri.<br />
2007, 70 sayfa<br />
4
ABSTRACT<br />
M.Sc. Thesis<br />
REAL TIME VEHICLE LICENSE PLATE RECOGNITION<br />
Halime BOZTOPRAK<br />
<strong>Süleyman</strong> <strong>Demirel</strong> University Graduate School of Applied and Natural Sciences<br />
Electronic-Telecommunication Department<br />
Vehicle license plate recognition systems are used for automated recognition of<br />
vehicles. They can be efficiently employed for traffic monitoring of roads, automated<br />
till collection.<br />
In this study, a license plate recognition system for the vehicles which have license<br />
plates, conform to Turkish Plates has been developed. The recognition process can<br />
be done in three major steps; Extraction of plate region, segmentation of plate<br />
characters and recognition of plate characters. For extraction of plate region have<br />
been used Top-hat transform and fiilling process. Vertical and horizontal projections<br />
are used for character segmentation. Character recognition has been achieved by<br />
support vector machines. Any deformation on the plate region of rectangular shape<br />
caused by an improper camera viewing parameters has been recovered.<br />
An accuracy of 98% is achieved for license plate localization and %91 for character<br />
segmentation and recognition.<br />
Key Words: License plate recognition, morphology processing, top-hat transform,<br />
character recognition, support vector machines.<br />
2007, 70 pages<br />
5
TEŞEKKÜR<br />
Bu tez için beni yönlendiren, bilgi ve tecrübesi ile bana yardımcı olan danışman<br />
hocam Prof. Dr. Mustafa MERDAN’a teşekkür ederim.<br />
Ayrıca tezimin her aşamasında beni yalnız bırakmayan ve destekleyen aileme ve<br />
arkadaşlarıma sonsuz sevgi ve saygılarımı sunarım.<br />
6<br />
Halime BOZTOPRAK<br />
ISPARTA, 2007
ŞEKİLLER DİZİNİ<br />
Şekil 1.1 Plaka örnekleri .........................................................................................13<br />
Şekil 2.1 Genişletme işlemi.....................................................................................21<br />
Şekil 2.2 Aşındırma işlemi......................................................................................21<br />
Şekil 2.3 Açma işlemi.............................................................................................22<br />
Şekil 2.4 Kapatma işlemi ........................................................................................22<br />
Şekil 2.5 Yapısal eleman örnekleri..........................................................................23<br />
Şekil 2.6 Gri seviyedeki genişleme işlemi ...............................................................24<br />
Şekil 2.7 Gri seviyedeki aşındırma işlemi ...............................................................24<br />
Şekil 2.8 Yeniden oluşturulma işlemi (Vincent, 1993).............................................25<br />
Şekil 2.9 TopHat dönüşümün aydınlık ve koyu nesneler için parlaklık gösterimi ....26<br />
Şekil 2.10 Top-Hat dönüşümünün elde edilmesi: a,e) yapı elemanı; b,f) orijinal<br />
resim; c,g) açma (diğeri kapama); d,h) çıkarma sonucu...........................................27<br />
Şekil 2.11 Hough Dönüşüm metodu ile doğruların bulunması.................................28<br />
Şekil 2.12 Bir doğrunun ifadesi...............................................................................29<br />
Şekil 2.13 (a) Sinüs eğrisi, (b) Kesişen noktalar .....................................................29<br />
Şekil 2.14 Kesişen doğruların grafiksel gösterilmesi ...............................................30<br />
Şekil 2.15 Karakter ön işlemleri..............................................................................31<br />
Şekil 2.16 İnceltme işlemi için yapısal elemanlar ....................................................31<br />
Şekil 2.17 İnceltme işlemi.......................................................................................31<br />
Şekil 2.18 İki boyutlu eğitim seti için bir (w,b) ayırıcı hiperdüzlemi .......................34<br />
Şekil 2.19 Giriş uzayından özellik uzayına dönüşüm...............................................36<br />
Şekil 2.20 Sınıflandırma işini basitleştiren bir özellik haritası .................................37<br />
Şekil 2.21 Sınır değerleri.........................................................................................43<br />
Şekil 3.1 Plaka bölgesinin bulunması......................................................................49<br />
Şekil 3.2 (a) Giriş görüntü, (b) Top-hat dönüşümü ..................................................49<br />
Şekil 3.3 Resmi plakaya uygulanan koyu nesneler için Top Hat dönüşümü.............50<br />
Şekil 3.4 (a) Orijinal görüntü, (b) Top hat dönüşümü ve doldurma işleminin<br />
uygulanmış hal, (c) ikilik seviyedeki görüntü..........................................................51<br />
Şekil 3.5 İkilik seviyedeki görüntü..........................................................................51<br />
7
Şekil 3.6 Etiketlenen görüntü ..................................................................................52<br />
Şekil 3.7 (a) Aday plaka bölgesi, (b) Etiketleme......................................................53<br />
Şekil 3.8 Plakası bulunacak görüntü........................................................................54<br />
Şekil 3.9 Bulunan plaka bölgesi ..............................................................................54<br />
Şekil 3.10 Hough dönüşümü ..................................................................................55<br />
Şekil 3.11 Plaka bölgesinin eğriliğin tespiti............................................................55<br />
Şekil 3.12 Shear dönüşümü.....................................................................................55<br />
Şekil 3.13 Shear dönüşümü uygulanmış plaka bölgesi.............................................56<br />
Şekil 3.14 Plaka çerçevesinin çıkarılması için dikey (a) ve yatay (b) izdüşüm .........57<br />
Şekil 3.15 Plaka karakterlerini içeren görüntü .......................................................57<br />
Şekil 3.16 [40 180] ebadında normalize edilmiş görüntü .........................................58<br />
Şekil 3.17 [20 100] ebadında normalize edilmiş görüntü .........................................58<br />
Şekil 3.18 [15 80] ebadında normalize edilmiş görüntü...........................................58<br />
Şekil 3.19 Karakterlerinin izdüşümü .......................................................................59<br />
Şekil 3.20 Karakter olmayan bölgelerin silinmesi....................................................59<br />
Şekil 3.21 Birleşen karakterlerin ayrıştırılması........................................................60<br />
Şekil 3.22 Plaka görüntüsünden plaka karakteri harici nesnelerin silinmesi.............60<br />
Şekil 3.23 Etiketleme ile karakterlerin ayrıştırılması ...............................................61<br />
Şekil 4.1 Plaka yer saptama biriminin başarılı olduğu farklı zamanlarda çekilen<br />
görüntüler ...............................................................................................................64<br />
Şekil 4.2 Plaka yer saptama biriminin başarısız olduğu görüntü ..............................65<br />
8
ÇİZELGELER DİZİNİ<br />
Çizelge 2.1 Geometrik dönüşümler .........................................................................18<br />
Çizelge 4.1 Plaka tanıma sisteminin test sonuçları...................................................63<br />
Çizelge 4.2 Plaka bölgesinin döndürülmesinin etkisi...............................................65<br />
Çizelge 4.3 Karakter tanıma başarısı .......................................................................66<br />
9
ai<br />
Langrange çarpanları<br />
b Bias terimi<br />
SİMGELER VE KISALTMALAR DİZİNİ<br />
D Herhangi bir nokta ile hiperdüzlem arasındaki mesafe<br />
DVM Destek vektör makineleri<br />
DV Destek vektörleri<br />
f(x) Hiperdüzlem denklemi<br />
iF<br />
Gösterge fonksiyonu<br />
k Sınıf sayısı<br />
L(w,b) Langrangian fonksiyonu<br />
n Eğitim örnekleri sayısı<br />
PST Plaka tanıma sistemi<br />
PYS Plaka yer saptama<br />
VC Vapnik chervonenkis boyutu<br />
x Serbestlik değişkenleri<br />
xi<br />
yi<br />
Giriş verileri<br />
Giriş verilerine uyan çıkış etiketleri<br />
w Ağırlık terimi<br />
10
1. GİRİŞ<br />
Görüntü işleme uygulamalarından biri olan plaka tanıma, günümüzde trafikteki araç<br />
sayısı göz önüne alındığında oldukça popüler uygulama alanlarındandır. Araç<br />
sayısının artması ve trafikte oluşan sorunlar, otomatik araç tanıma ve trafik akış<br />
kontrolü sistemlerinde duyulan ihtiyacı arttırmıştır. Bu amaca yönelik çalışmalar<br />
temel olarak araçları özel bir noktadan geçerken tanımlamak, aracın konumunu<br />
belirlemek, davranışlarını gözlemlemek ve bu verileri kullanarak trafik denetimini<br />
sağlamaya yöneliktir. Otomatik taşıt plakası tanıma sistemlerini (PTS-Plaka Tanıma<br />
Sistemi) kullanışlı ve pratik yapan; aracı belirlemek için hali hazırda aracın üzerinde<br />
olan plakayı kullanmasıdır. Plaka araca ait her türlü bilgiyi içermektedir. Ek hiç bir<br />
bilgiye ya da araca takılacak ek donanıma gerek kalmadan, aracın belirlenmesi bu<br />
PTS sistemleri ile mümkündür.<br />
Giriş-çıkışların sınırlanması ve kontrol altına alınması gereken tesisler, ücretli<br />
otoyollar, otopark uygulamaları, akan trafikte araçların takibi ve otoyol otomatik<br />
geçiş plaka tanıma sistemlerinin başlıca uygulama alanlarıdır. Giriş-çıkışların kontrol<br />
altına alınması gereken yerlerde, işlemin insan tarafından yapılması, işlem süresini<br />
artırmakta ve güvenilirliğini azaltmaktadır.<br />
Araç plaka tanıma günümüzde otomatik park sistemleri, trafik denetimi, araç takibi,<br />
köprü ve otoyol otomatik geçiş sistemleri gibi birçok alanda kullanılmaktadır. Bu<br />
nedenle plakaların tanınması ve plaka yerinin saptanması ile ilgili literatürde pek çok<br />
çalışma bulunmaktadır. Örneğin, kenar ayrıştırma (Boroujeni, 2000; Hongliang ve<br />
Changping, 2004), Hough dönüşümü (Kamat ve Ganesan, 1995; Shapiro vd., 2003),<br />
simetri özelliği (Kim ve Chien, 2001), morfolojik işlemler (Hsieh vd., 2001;<br />
Hongliang ve Changping, 2004), renk özelliği, histogram analizi v.s gibi sayısız<br />
teknikler önerilmiştir. Yaygın olarak kullanılan plaka yer saptama yöntemlerini ayrıt<br />
11
temelli ya da bölge temelli yaklaşımlara dayanmaktadır. Plakanın dikdörtgen olduğu<br />
varsayımına dayalı olarak yatay ve düşey doğrultudaki ayrıtlara Hough dönüşümü<br />
uygulanarak plakayı çevreleyen sınırları saptayan yöntemler önerilmiştir (Kamat ve<br />
Ganesan, 1995). Bu yöntem yüksek işlem yükü ve bellek ihtiyacı nedenleriyle gerçek<br />
zamanlı sistemlerde tercih edilmemektedir. Ayrıca, yöntem, karmaşık artalana sahip<br />
görüntülerde yüksek negatif hata oranı vermektedir. Ayrıca çizgi histogramlarını<br />
analiz ederek plaka örüntüsüne özgü imzayı arayan (Barroso vd., 1997) veya plaka<br />
renk bilgisini kullanan (Kim vd.) plaka yer saptama yöntemleri mevcuttur. Ancak bu<br />
yöntemler gürültü ve perspektif bozulmalarına karşı oldukça duyarlıdır. Kenara bağlı<br />
yaklaşım normal olarak basit ve hızlıdır. Ancak istenmeyen kenarlara çok hassastır.<br />
Plaka yerinin tespit edildiği ve bunun için arka plan renginin kullanıldığı<br />
uygulamalarda, başarı oranı düşmekte ve en fazla %70’lerde kalmaktadır. Renkleri<br />
kullanılarak plaka bölgesi bulan yöntemlerde, yalnızca plakanın fon rengi<br />
aranmasının performansı düşürdüğü gözlenmiştir. Plakanın fon rengi ile aracın aynı<br />
renk olması durumunda ise plaka bölgesi bulunamamaktadır (Çamaşırcıoğlu, 2007).<br />
Literatürdeki birçok yöntem, plaka görüntülerinin hemen hemen tam karşıdan<br />
çekildiği varsayımı veya kısıtı altında çalışmaktadır. Genel olarak ayrıt saptama ve<br />
eşikleme tabanlı plaka yer saptama yöntemleri, plakanın belirli bir açı ile x-y<br />
düzleminde dönmesinden ve kameranın konumundan dolayı oluşan perspektif<br />
bozulmalardan kaynaklanan düşük başarıma sahiptir. Literatürde, x-y düzlemindeki<br />
dönme açısı, histogram analizi ve karakterlerin altından geçtiği varsayılan baz<br />
çizgisinin bularak saptamaya çalışan yöntemler bulunmaktadır. Bu yöntemler<br />
belirledikleri bu açıyı kullanarak giriş görüntüsünü dönmeden bağımsız hale<br />
getirirler.<br />
Plaka karakterlerinin ayrıştırılması için çeşitli yöntemler önerilmiştir: İzdüşüm<br />
histogramları (Yong vd., 2000) ve dikey kenarlar, morfoloji (Hsieh vd., 2000;<br />
12
Hongliang vd., 2004), bağlantılı bileşen analizi kullanan yöntemleri sayabiliriz. Bu<br />
yöntemlerin kendine göre kazanımları ve yitimleri bulunmaktadır. Ayrıca bu<br />
yöntemler belirli kısıtlar altında çalışmaktadır. Örneğin izdüşüm histogramına dayalı<br />
yöntemler plaka doğrultusunun, morfoloji temelli yöntemler ise plaka karakterlerinin<br />
boyutlarının bilindiğini varsayar (Kahraman vd., 2003).<br />
Araç plakalarının standartları ülkeden ülkeye ve hatta aynı ülke içerisinde dahi<br />
geometrik şekilleri itibariyle farklılık gösterebilmektedir. Plakalarının ortak<br />
özellikleri, sabit arka planları ile karakterler arasında yüksek kontrast olmasıdır.<br />
Değişik format ve renkte plakaların olması plaka yer saptama ve plaka tanıma<br />
problemini zorlaştıran etkenlerden biridir.<br />
Şekil 1.1 Plaka örnekleri<br />
Türkiye trafik denetleme kurumlarına kayıtlı yasal plakalar; sivil, resmi, askeri,<br />
diplomatik vs. gibi değişik renk ve biçimlerde olabilmektedir. Bu çalışmada,<br />
plakaların açık renkteki arkalan üzerindeki koyu karakterler veya koyu arkalan<br />
üzerindeki açık renkteki karakter içeren plaka tiplerinin tanınması amaçlanmıştır<br />
(Şekil 1.1).<br />
Plakaların resmi bir standardı olmasına rağmen, trafikte araçların bir kısmında<br />
standartlara uygun olmayan plakalar bulunmaktadır. Bununla birlikte, plakalar<br />
üzerinde çeşitli yabancı maddelerin; damgalar, çıkartmalar, fosforlar, pullar, vidalar,<br />
çamur v.b gibi bulunması ve kameradan elde edilecek görüntülerin kalitesinin<br />
13
aydınlatmaya bağlı olarak değişkenlik göstermesi ve aracın hızı, taşıt tanıma<br />
sisteminin yapılmasını güçleştiren faktörlerdir. Yukarıda belirtilen problemleri<br />
aşmak için, bazı görüntü işleme teknikleri kullanılmıştır.<br />
Bu tez çalışmasında, kuramsal temeller bölümde sistemde kullanılan gerekli bazı<br />
algoritmalardan bahsedilmiş, materyal ve yöntem bölümünde plaka tanıma sistemin<br />
çalışması açıklanmıştır. Daha sonra araştırma bulguları ve tartışma kısmında sistemin<br />
başarısı tartışılmıştır.<br />
14
2. KURAMSAL TEMELLER<br />
Bu bölümde yararlanılan görüntü işleme algoritmaları ve kullanılan yöntemler<br />
hakkında bilgi verilmiştir.<br />
2.1.1 Gerçek renk-gri skala dönüşümü<br />
İnsan görme sistemi, RGB (kırmızı, yeşil, mavi - red, green, blue) renk bölgesinde<br />
algılama yapar. Kırmızı, yeşil ve mavi ana renk bileşenlerinin her biri ayrı ayrı üç<br />
farklı matriste tutulur. Bahsi geçen üç matrisin bir arada, üst üste görüntülenmesi ile<br />
gerçek renk bileşenleri oluşur.<br />
Gerçek renk-gri skala dönüşümü, (2.1) denklemiyle bulunur.<br />
Y = 0.299R + 0.587G + 0.114B<br />
(2.1)<br />
Gerçek renk bileşenlerine sahip bir resmin işlenmesi, işlem sayısını artırır. Bu<br />
sebeple, resmin gri seviyeye ve hatta işlemin amacına göre siyah beyaz ikili forma<br />
dönüştürülmesi işlem sayısının asgaride tutulmasını sağlayacaktır.<br />
2.1.2 Eşikleme<br />
Gri seviye bir resim, her bir piksel için 0 ile 255 arasında bir parlaklık değeri alır. Ve<br />
gri tonda görüntü işte bu farklı parlaklık değerlerine göre oluşur. 0 değeri siyah 255<br />
ise beyazdır. Eşikleme işlemi, görüntü işlemenin önemli işlemlerinden biridir.<br />
Eşikleme işlemi, değişik gri ton seviyelerine sahip bir resmi ikilik seviyeye yani; 0<br />
siyah, 1 beyaz rengi göstermek üzere resmi 0 ve 1’lerden oluşan bir matris haline<br />
getirir. Eşikleme yaparken bir eşik değeri belirlenir ve bu değerin üstündeki değerler<br />
için çıkış imgesindeki ilgili piksele 1, altındaki değerler içinde 0 değeri atanır.<br />
Eşiklemenin genel ifadesi denklem (2.2)’de verilmiştir.<br />
G( i, j) = 1 f ( i, j) ≥ T için<br />
G( i, j) = 0 f ( i, j) < T için<br />
15<br />
(2.2)
Burada:<br />
T = Eşik<br />
G( i, j ) = 1 Nesnenin görüntü elemanları<br />
G( i, j ) = 0 Arka planın görüntü elemanlarıdır.<br />
Eğer görüntüdeki nesneler temassız ve gri seviyeleri açıkça arka planın gri<br />
seviyesinden farklı ise eşikleme uygun bir ayrıştırma metodudur. Doğru eşik seçimi<br />
başarılı bir görüntünün ayrıştırılabilmesi için gereklidir. Bu seçim etkileşimli veya<br />
çeşitli eşik tanımlama algoritmalarıyla yapılır.<br />
2.1.2.1 Otsu Eşik Belirleme Yöntemi<br />
Resmin etkili ve hızlı bir şekilde işlenebilmesi için en temel model olan siyah-beyaz<br />
modele dönüştürülmesi gerekir. Her gri resmin parlaklık değeri, çekildiği atmosfer<br />
koşullarına ve çevresel koşullara göre farklılık göstereceğinden, bu eşik seviyesinin<br />
değişken olarak belirlenebiliyor olması önem kazanır. Otsu’nun bölgesel eşikleme<br />
algoritması (Otsu, 1979) bu değişken eşik seviyesini bulmak için kullanılır. Bulunan<br />
eşik seviyesi [0,1] aralığında, parlaklık parametresidir. Bu eşik değerini bulduktan<br />
sonra ise gri resim, siyah beyaza çevrilir.<br />
Otsu’nun bölgesel eşikleme algoritması; kendi içinde ağırlıklandırılmış ve<br />
sınıflandırılmış değişintiyi (varyansı) minimize edecek şekilde çalışır. Bu sınıfların<br />
birbiri ile olan değişintisini ise maksimize edecektir. Bölgesel eşikleme algoritması,<br />
gri skala resimlerinde (0, 256) arasında değer alan pikseller için, P(i) çalışır.<br />
Sınıfların birbiri arasındaki değişintisi:<br />
σ ( t) = q ( t) σ ( t) + q ( t) σ ( t)<br />
(2.3)<br />
2 2 2<br />
w 1 1 2 2<br />
16
Tahmin edilen sınıfsal olasılıklar<br />
t I<br />
∑ ∑ (2.4)<br />
q ( t) = P( i) q ( t) = P( i)<br />
1 2<br />
i= 1 i=<br />
1+ 1<br />
Sınıfların ortalamaları:<br />
t I<br />
iP( i) iP( i)<br />
µ ( t) = µ ( t)<br />
=<br />
q ( t) q ( t)<br />
∑ ∑ (2.5)<br />
1 2<br />
i= 1 1 i= t+<br />
1 2<br />
Ve son olarak sınıfların değişintisi:<br />
P( i)<br />
t<br />
2<br />
2<br />
( t) = ( )<br />
1 ∑ ⎡<br />
⎣i − t ⎤ 1 ⎦<br />
(2.6)<br />
i=<br />
1 q ( t)<br />
1<br />
σ µ<br />
P( i)<br />
I<br />
2<br />
2<br />
( t) = ( )<br />
2 ∑ ⎡<br />
⎣i − t ⎤ 2 ⎦<br />
(2.7)<br />
i= t+<br />
1 q ( t)<br />
2<br />
σ µ<br />
t değerleri içinden (1,256 aralığı) en küçük σ ( ) değerini verenler seçilir.<br />
Toplam değişinti, belirlenen eşik seviyesinden bağımsızdır. Sınıfların birbiri<br />
arasındaki değişintisi ile sınıflar arası değişintinin toplamıdır.<br />
17<br />
w t<br />
2 2<br />
σ = σ ( t) + q ( t) ⎡1 q ( t) µ ( t) µ ( t)<br />
w 1 ⎣ − ⎤ ⎡ ⎤<br />
1 ⎦ ⎣ − 1 2 ⎦ (2.8)<br />
Ağırlıklandırılmış<br />
değişinti<br />
Yukarıdaki formülden bakıldığında ağırlıklandırılmış değişinti değerinin azaldığı<br />
durumda sınıflar arası değişintinin artacağı daha net bir biçimde ifade edilmektedir.<br />
Sınıflar arası değişintinin değerleri; t değerleri iteratif olarak formülde yerine<br />
konarak hesaplanabilir.<br />
İterasyonun Başlangıcı:<br />
q (1) = P (1); µ (0) = 0<br />
(2.9)<br />
1 1<br />
Sınıflar arası değişinti: σ<br />
2<br />
2<br />
( ) B t
Tekrarlayan Kısım için:<br />
q ( t + 1) = q ( t) + p( t + 1)<br />
(2.10)<br />
1 1<br />
q ( t) µ ( t) + ( t + 1) P( t + 1)<br />
1 1<br />
µ ( t + 1) =<br />
1<br />
q ( t + 1)<br />
µ − q ( t + 1) µ ( t + 1)<br />
1 1<br />
µ ( t + 1) =<br />
2<br />
1 − q ( t + 1)<br />
2.2. Geometrik Dönüşümler<br />
1<br />
1<br />
18<br />
(2.11)<br />
(2.12)<br />
İşlenmemiş görüntüler genellikle geometrik bozulmaları içerir. Bu çalışmada, 2-D<br />
veya N-D boyutlar için kullanılan affine dönüşümüne ait bazı geometrik dönüşümler<br />
Çizelge 2.1’de gösterilmiştir.<br />
Çizelge 2.1 Geometrik dönüşümler<br />
Affine Dönüşümü Örnek Dönüşüm Matrisi<br />
Translation<br />
(Yer değiştirme)<br />
Ölçekleme<br />
(skalama)<br />
Shear<br />
Döndürme<br />
⎡1 0 0⎤<br />
⎢ ⎥<br />
⎢0 1 0⎥<br />
⎢tx t y 1⎥<br />
⎣ ⎦<br />
⎡sx 0 0⎤<br />
⎢<br />
0 sy<br />
0<br />
⎥<br />
⎢ ⎥<br />
⎢⎣ 0 0 1⎥⎦<br />
⎡ 1 shy<br />
0⎤<br />
⎢<br />
shx<br />
1 0<br />
⎥<br />
⎢ ⎥<br />
⎢⎣ 0 0 1⎥⎦<br />
⎡ cos( q) sin( q)<br />
0⎤<br />
⎢<br />
sin( q) cos( q)<br />
0<br />
⎥<br />
⎢<br />
−<br />
⎥<br />
⎢⎣ 0 0 1⎥⎦<br />
tx : x ekseni boyunca yer<br />
değiştirme<br />
ty : y ekseni boyunca yer<br />
değiştirme<br />
sx: x ekseni boyunca<br />
ölçekleme değeri<br />
sy: y ekseni boyunca<br />
ölçekleme değeri<br />
shx: x ekseni boyunca<br />
shear değeri<br />
shy: y ekseni boyunca<br />
shear değeri<br />
q: dönme açısı
2.3. Bölgelerin Etiketlenmesi<br />
İkilik bir resim içerisinde birbiri ile hiçbir piksel komşuluğu olmayan nesnelerin<br />
değişik renklere boyanması ile resim içerisindeki bu nesnelerin birbirinden ayrılması<br />
işlemine etiketleme (labeling) denir (Karaman, 2001).<br />
Etiketleme işlemini gerçekleştirmek için, ikili seviyedeki bir resmin (0,0) orjin<br />
noktasından itibaren yani sol üst köşesinden başlamak suretiyle piksel piksel taranır.<br />
Taranan resimdeki nesneler beyaz, artalan ise siyah renkte olan bu ikilik resimde<br />
tarama esnasında beyaz bir piksele rastlandığında, bu pikselin tüm komşuluklarına<br />
bakılır. Ve komşulukları arasında önceden etiketlenmiş başka bir piksel varsa bu<br />
beyaz piksele de aynı etiket atanır. Eğer bu beyaz pikselin komşuları arasında<br />
birbirinden farklı etiketlere sahip birden fazla piksel varsa bu etiketlerden en küçük<br />
değerlere sahip olanı bu beyaz piksele etiket değeri olarak atanır. Aynı zamanda<br />
birbirine komşu oldukları halde farklı etiket değerleriyle etiketlendirilmiş olan<br />
piksellere ait etiketler bir eşitlik tablosunda birbirine eşitlenir. Böylelikle bu<br />
piksellerin etiket değerleri farklı olsa da, aslında bu piksellerin aynı nesnenin bir<br />
parçası olduğu eşitlik tablosunda belirtilmiş olur. Eşitlik tablosundaki bu bilgiler bir<br />
sonraki tarama işleminde kullanılmak üzere saklanır (Oral, 1996). Eğer tarama<br />
esnasında rastlanan beyaz etiketlenmemiş pikselin komşuları arasında daha önceden<br />
etiketlenmiş bir piksel yoksa bu piksele yeni bir etiket değeri atanır. Böylece bu<br />
pikselin yeni bir nesneye ait bir piksel veya daha önceden etiketlendirilmiş bir<br />
nesnenin alt çıkıntılarından birine ait bir piksel olduğuna karar verilmiş olur.<br />
Tarama bu şekilde resmin tamamını kapsayacak biçimde yapılır. Tarama sonunda<br />
eşitlik tablosunda hangi etiketlerin aslında aynı nesneyi temsil ettiği eşitlik<br />
tablosundaki bilgiler ışığında tespit edilir. Bu yeni veriler göz önünde tutularak resim<br />
baştan sona tekrar taranır ve eşitlik tablosunda aynı nesneye verilen değerler arasında<br />
19
en küçük değere sahip olan pikselin etiketi, aynı nesnenin tüm piksellerine etiket<br />
değeri olarak atanır. Bu işlem tüm resim taranacak şekilde yapılır. Tarama işlemi<br />
tamamlandıktan sonra resim içerisinde birbirlerine piksel komşulukları olmayan tüm<br />
nesneler farklı bir renge boyanmış, yani etiketlendirilmiş olur.<br />
Etiketleme işlemi sonunda elde edilen resim içerisinde kullanılan farklı etiketlerin<br />
adetinin sayısının tespiti bize o resim içerisinde toplam (birbirine piksel komşuluğu<br />
olmayan) nesne olduğunu bildirir. Böylelikle resim içerisindeki nesneleri otomatik<br />
olarak saydırmış oluruz.<br />
2.4. Morfolojik İşlemler<br />
Morfolojik imge işlemede temel olarak kullanılan iki işlem vardır: Genişletme<br />
(dilation) ve Aşındırma (erosion). Diğer morfolojik işlemler, bu temel iki işlem<br />
kullanılarak elde edilir.<br />
Genişletmek (Yayma): İkili imgedeki nesneyi büyütmeye ya da kalınlaştırmaya<br />
yarayan morfolojik işlemdir. Sayısal bir resmi genişletmek demek resmi yapısal<br />
elemanla kesiştiği bölümler kadar büyütmek demektir. Kalınlaştırma işleminin nasıl<br />
yapılacağı yapı elemanı (structure element) belirler. Yapısal eleman resim üzerinde<br />
piksel piksel dolaştırılır. Eğer yapısal elemanın orjini resim üzerinde "0" değerli bir<br />
piksel ile karşılaşırsa herhangi bir değişiklik meydana gelmez. Eğer değeri "1" olan<br />
bir piksel ile karşılaşırsa yapısal elemanla yapısal elemanın altında kalan pikseller<br />
mantıksal "veya" işlemine tabi tutulurlar. Yani herhangi "1" değeriyle sonuç "1" e<br />
çevrilir. Genişletme ile resim üzerindeki nesneler şişer. Nesne içinde delikler var ise<br />
bunlar kapanma eğilimi gösterirler. Ayrık nesneler birbirine yaklaşır ya da bağlanır.<br />
Şekil 2.1’de 3x3 yapısal elemanı ile sayısal resim üzerine genişletme işleminin<br />
uygulanması gösterilmiştir. 3x3 lük yapısal elemanın tüm değerleri "1" dir.<br />
20
Şekil 2.1 Genişletme işlemi<br />
Aşındırma işlemi, ikili imgedeki nesneyi küçültmeye ya da inceltmeye yarayan<br />
morfolojik işlemdir. Aşındırma işlemi bir bakıma genişletmenin tersi gibi görülebilir.<br />
Burada yine aynı şekilde yapısal eleman resim üzerinde piksel piksel dolaştırılır fakat<br />
bu defa yapısal elemanın merkez pikseli "1" değeri ile karşılaşırsa yapısal eleman<br />
içerisindeki piksellerin durumuna bakılır. Eğer yapısal eleman içerisindeki "1" olan<br />
piksellerden herhangi biri altında resme ait "0" değeri varsa yapısal elemanın diğer<br />
"1" lerinin altındakilerle beraber bu piksel "0"’a dönüştürülür.<br />
Aşındırma (erozyon, erosion) işlemi ile sayısal resim aşındırılmış olur. Yani resim<br />
içerisindeki nesneler ufalır, delik varsa genişler, bağlı nesneler ayrılma eğilimi<br />
gösterir.<br />
Şekil 2.2’de 3x3 yapısal elemanı ile sayısal resim üzerine aşındırma uygulanması<br />
gösterilmiştir. 3x3 lük yapısal elemanın tüm değerleri "1" dir.<br />
Şekil 2.2 Aşındırma işlemi<br />
21
Açma işlemi, sayısal bir resme önce aşındırma daha sonra genişletme uygulanırsa<br />
resme açma işlemi uygulanmış olur. Açma işlemine tabi tutulmuş bir görüntü ve<br />
değişimi Şekil 2.3’de gösterilmiştir. Burada yine 3x3 lük yapısal eleman<br />
kullanılmıştır.<br />
Şekil 2.3 Açma işlemi<br />
Kapatma işlemi, sayısal resme önce genişletme daha sonra aşındırma uygulanırsa<br />
Kapatma işlemi uygulanmış olur. Şekil 2.4‘de kapatma işlemi uygulanmış bir<br />
görüntünün önce ve sonrası durumları incelenmiştir.<br />
Şekil 2.4 Kapatma işlemi<br />
Açma işlemi ile birbirine yakın iki nesne görüntüde fazla değişime sebebiyet<br />
vermeden ayrılmış olurlar. Kapatmada ise birbirine yakın iki nesne görüntüde fazla<br />
değişiklik yapılmadan birbirine bağlanmış olur.<br />
A ⊕ B ↔Genişletme<br />
A Θ B ↔ Aşındırma<br />
22
A o B = ( A Θ B ) ⊕ B ↔ Açma işlemi<br />
A ● B = ( A ⊕ B ) Θ B ↔ Kapama işlemi<br />
Yapısal eleman, birçok morfoloji işleminin gerçekleştirilmesinde en önemli öğedir.<br />
Sayısal resimler matematiksel ifade oldukları için matematiksel morfoloji özellikleri<br />
kullanılır.<br />
Aslında yapısal eleman olarak adlandırılan ifade istenilen boyutlarda ve istenilen<br />
şekilde hazırlanmış küçük ikilik bir resimdir. Yapısal eleman çeşitli geometrik<br />
şekillerden biri olabilir; en sık kullanılanları kare, dikdörtgen ve dairedir. Yapısal<br />
eleman örnekleri Şekil 2.5’de gösterilmektedir.<br />
Şekil 2.5 Yapısal eleman örnekleri<br />
Yapısal elemanın merkez pikselinin ikili seviyede bir resim içerisindeki nesnelere (1<br />
lere) temas etmesiyle ortaya çıkan nesne ile yapısal elemanın kesişim kümesi<br />
"nesneden çıkartılarak" veya "nesneye eklenerek" birçok morfolojik işlem<br />
gerçekleştirilir. Buradaki en önemli nokta nesneye eklenen ya da nesneden çıkarılan<br />
kısmın yapısal eleman tarafından belirlenmesidir.<br />
Eğer morfolojik işlemin sonucunda resimdeki nesnelerin keskin hatları silinip<br />
yerlerine kavisli veya daha yumuşak hatlar getirilmek isteniyorsa dairesel yapısal<br />
eleman kullanılmalıdır. Örneğin erozyon işleminde resim içerisindeki nesnelerin en<br />
ve boyları aynı oranda azaltılmak (erozyona uğratılmak) isteniyorsa yapısal eleman<br />
kare seçilmelidir.<br />
23
Gri seviyeli morfolojik işlemler: Gri seviyeli bir görüntünün b yapısal elemanı ile<br />
genişletme işlemi denklem (2.13) ile ifade edilir (Gonzalez ve Woods, 1993).<br />
( )( ) max{ ( ',<br />
')<br />
( ',<br />
')<br />
| ( ',<br />
' )} D y x y x b y y x x f y x b f ∈<br />
+ − − =<br />
⊕ , b (2.13)<br />
Burada Db: b’nin etki alanıdır. Genişletme işleminden sonra resim genelde daha<br />
parlaktır.<br />
Şekil 2.6 Gri seviyedeki genişleme işlemi<br />
Gri skalalı aşındırma işlemi (2.14) denklem ile ifade edilir. Aşındırma işleminden<br />
sonra resim genelde daha koyudur.<br />
( )( ) min{ ( ',<br />
')<br />
( ',<br />
')<br />
| ( ',<br />
' )} D y x y x b y y x x f y x b f ∈<br />
+ − − =<br />
Θ (2.14)<br />
, b<br />
Şekil 2.7 Gri seviyedeki aşındırma işlemi<br />
24
( fΘb)<br />
b<br />
f � b = ⊕ ↔ Açma<br />
( f ⊕b)<br />
b<br />
f • b = Θ ↔ Kapama<br />
Doldurma işlemi: Doldurma işlemi gri skaladaki bir resimde bulunan boşlukları<br />
kapatmak için kullanılan morfolojik işlemlerin yeniden oluşturulmasıyla<br />
(reconstruction) meydana gelen bir algoritmadır.<br />
Yeniden oluşturulma işlemi: Bir resim ve yapısal elemandan ziyade işaretleyici<br />
(marker) ve maske (mask) olmak üzere iki resme bağlı olarak elde edilir. İşlemler,<br />
kararlılık sağlanıncaya kadar tekrar eder, resim artık değişmez.<br />
L ve I iki gri skalalı resim olsun, piksel değerleri {0,1,…,N} kümesinden seçilmiş<br />
olsun ve J
işlemler kullanılarak elde edilir. Tepe veya çukur bölgeleri belirginleştirme<br />
özelliğine sahiptir (Karp, 2005).<br />
Aydınlık nesneler için,<br />
TopHat [A, B] = A - (A○B) (2.16)<br />
karanlık nesneler için de,<br />
TopHat[A, B] = (A●B) - A (2.17)<br />
verilmiştir. Burada,<br />
B : Yapı elemanı<br />
(a) Orijinal görüntü<br />
Şekil 2.9 TopHat dönüşümün aydınlık ve koyu nesneler için parlaklık gösterimi<br />
Şekil 2.9.a’da orijinal görüntünün pozisyona göre parlaklık değeri görülmektedir. Bu<br />
görüntüye TopHat uygulanmasıyla Şekil 2.9.b,c’de aydınlık ve koyu nesneler için<br />
ayrı ayrı elde edilen parlaklık değişimleri gösterilmiştir.<br />
26
TopHat dönüşümü, açma veya kapama işlemleri uygulanmasıyla elde edilir; aydınlık<br />
nesneler için, orijinal resimden açma işleminin çıkarılması ile karanlık nesneler<br />
içinse kapama işleminin orijinal resimden çıkarılmasıyla. Şekil 2.10’da her iki durum<br />
için top-hat dönüşümü işlemleri gösterilmiştir (Candeas, 1997).<br />
Şekil 2.10 Top-Hat dönüşümünün elde edilmesi: a,e) yapı elemanı; b,f) orijinal<br />
resim; c,g) açma (diğeri kapama); d,h) çıkarma sonucu<br />
Şekil 2.10.c’de f orijinal sinyale düz yapı elemanıyla (Şekil 2.10.a) uygulanan açma<br />
işlemi görülmektedir. Şekil 2.10.d’de orijinal resimden açma işlemi uygulanmış<br />
resmin çıkarılmasıyla elde edilen tepe noktalarının saptanması gösterilmiştir. Şekil<br />
2.10.b’de de kapama işleminden orijinal resimden çıkarılmasıyla çukur bölgelerin<br />
saptanması görülmektedir.<br />
2.6. Hough Dönüşümü<br />
Hough Dönüşümü sayısal görüntü işlemede matematiksel olarak ifade edilebilen<br />
şekillerin varlığının, yerinin, açılarının vs bulunmasında kullanılabilir. Yöntem 1962<br />
yılında Paul Hough tarafından bulunmuştur. IBM tarafından patentlidir.<br />
Yöntem daha çok resimdeki doğruların tespitinde kullanılır ancak genelleştirilmiş<br />
Hough dönüşümü matematiksel olarak ifade edilebilen bütün şekillerde çalışır.<br />
27
Şekil 2.11 Hough Dönüşüm metodu ile doğruların bulunması<br />
Bu çalişmada, Hough Dönüşüm metodu ile doğru bulunması ve metodun algoritması<br />
incelenecektir.<br />
Hough Dönüşüm yöntemi Edge (kenar) bilgisi elde edilmiş Gri-seviye imgeler<br />
üzerine uygulanır. Yöntem imge uzayındaki bilgiyi parametre uzayına taşıyarak şekil<br />
bulma problemini bir yoğunluk bulma problemine dönüştürür.<br />
Bir doğru genel olarak,<br />
y = ax + b<br />
(2.18)<br />
şeklinde ifade edilir. Parametre uzayında her farklı (a,b) çifti farklı bir doğruyu<br />
temsil etmektedir. Bu gösterimle dikey doğrular ifade edilemez.<br />
Doğruyu ifade etmenin bir başka yöntemi:<br />
x.cos Θ + y.sin Θ – p = 0<br />
(2.19)<br />
şeklindedir. ( p : ifade edilen doğruya orjinden çizilen dikme)<br />
28
y<br />
)Θ x<br />
Şekil 2.12 Bir doğrunun ifadesi<br />
Her farklı (Θ,r) çiftimiz farklı bir doğruyu ifade etmektedir. Görüntü üzerindeki her<br />
noktadan farklı (Θ,r) şeklinde ifade edilebilen sonsuz sayıda doğru geçer. Parametre<br />
uzayında (x,y) şeklinde olan noktamızı her farklı Θ ye karşı gelen p şeklinde çizersek<br />
bu noktayı ifade eden bir sinus eğrisi elde ederiz.<br />
(a) (b)<br />
Şekil 2.13 (a) Sinüs eğrisi, (b) Kesişen noktalar<br />
Bütün noktalarımıza bu yöntemi uygularsak eğrilerimiz Şekil 2.13.b’de görüldüğü<br />
gibi bazı noktalarda kesişecektir. Bu kesişim noktaları aynı Θ ya karşılık gelen aynı<br />
p’lerdir. Yani farklı noktaların oluşturduğu aynı doğrulardır. (Bir doğru üzerindeki<br />
faklı noktalar).<br />
y = ax + b<br />
x cos Θ + y sin Θ = p<br />
p<br />
29<br />
( Θ,<br />
p)<br />
Θ
Şekil 2.14 Kesişen doğruların grafiksel gösterilmesi<br />
Şekil 2.14’deki grafikte bir noktadan geçen sinüs eğrilerinin sayısının fazla olması o<br />
noktanın bir doğru ifade etmesi ihtimalini güçlendirir. Buradaki darbe bölgeleri<br />
doğruların bulunduğu bölgelerdir.<br />
2.7. Karakter Tanıma<br />
Bilgisayarın, bir resmin içindeki bilgiyi kullanabilmesi için yorumlaması<br />
gerekmektedir. Başka bir deyişle, karakter tanıma, bir resimdeki yazıların<br />
bilgisayarın anlayacağı, daha kolay ve verimli saklayıp, bulabileceği sembollere<br />
çevrilmesidir.<br />
Ön işleme algoritmaları, ihtiyaç duyulan verileri, ileriki aşamalar için uygun hale<br />
getirmeyi sağlar. Diğer bir değişle, gerçek dünya ile tanıma motorları arasındaki<br />
köprüyü sağlar.<br />
2.7.1 Karakter Tanıma Ön İşlemler<br />
Karakter tanıma işlemi genel olarak ön işlemleri gerektirmektedir. Ön işlemlerden<br />
bazıları eşikleme, inceltme, onarma ve normalleştirmedir.<br />
30
Şekil 2.15 Karakter ön işlemleri<br />
2.7.1.1 Eşikleme<br />
Eşikleme giriş karakterinin ikilik görüntüsünü elde etmek için kullanılır.<br />
2.7.1.2 İnceltme<br />
İnceltme (iskelet alma ya da skeleton) işlemi ikilik bir resme aşağıdaki 8 yapısal<br />
elemanın uygulanması ile yapılır. Ve bu uygulamalar kaynak görüntüde ciddi bir<br />
değişikliğe sebebiyet vermeyene kadar tekrarlanır.<br />
0 0 0 X 0 0 1 X 0 X 1 X 1 1 1 X 1 X 0 X 1 0 0 X<br />
X 1 X 1 1 0 1 1 0 1 1 0 X 1 X 0 1 1 0 1 1 0 1 1<br />
1 1 1 X 1 X 1 X 0 X 0 0 0 0 0 0 0 X 0 X 1 X 1 X<br />
Şekil 2.16 İnceltme işlemi için yapısal elemanlar<br />
Burada X durumu önemli değildir. X ne olursa olsun aynı sonuç alınacaktır.<br />
Şekil 2.17’de inceltilme öncesi ve sonrası farklı tonlar ile gösterilmiş aslında ikilik<br />
seviyede olan bir resim örneği yer almaktadır. Gri ile gösterilmiş (aslında resmin ilk<br />
hali olan) alanlar inceltme işlemi sonrasında siyah olarak ifade edilmişlerdir.<br />
Şekil 2.17 İnceltme işlemi<br />
31
İnceltme işlemi tanıma işlemini daha kolay ve hızlı bir hale getirir. Ayrıca<br />
oluşabilecek hataları en aza indirir. Çerçevelenmiş karakterdeki bilgi taşıyan siyah<br />
piksel sayısını en aza indirdiği için, isleme sokulacak nokta sayısı azalmış olur. Bu<br />
da program hızını artırır.<br />
2.7.1.3 Onarım<br />
Onarım işleminde, kalınlaştırma işlemi kullanılarak kopuk çizgilerin birleştirilmesi,<br />
eğri ve doğruların biçimlerinin düzenlenmesi sağlanır. Morfolojik işlem uygulanarak<br />
elde edilir.<br />
2.7.1.4 Normalleştirme<br />
Normalleştirme, yazı karakterlerinden kaynaklanan farklılıkların ortadan kaldırılarak<br />
standart bir şekle getirilmesidir. Genellikle karakter geometrisindeki değişim olarak<br />
tanımlanabilir. Değişimler, pozisyon, boyut ve konumda olabilir. Örneğin 12x7 ve<br />
14x8 boyutlarında bir karakterin 25x25 bir alana taşınması bir normalleştirme<br />
(ölçekleme) işlemidir. Böylece, karakter belli bir standart ölçüye getirilir<br />
2.7.2 Korelasyon ile Karakter Tanıma<br />
Tek başına, sabit boyutlu, düzlemle açısı sıfır olan karakterleri tanımak için etkili bir<br />
yöntemdir (Kittler, Pattern Recognition, 1988). Iki rastlantısal değişkenin birbiri ile<br />
doğrusal olarak benzerliğinin bir ölçüsüdür.<br />
Burada;<br />
ρ<br />
X , Y<br />
cov( X , Y ) E(( X − µ )( Y − µ ))<br />
X Y<br />
= = (2.20)<br />
σ σ σ σ<br />
X Y X Y<br />
ρ : X,Y’nin korelasyonu<br />
X , Y<br />
µ : Beklenen değer<br />
X<br />
σ : Standart sapma<br />
X<br />
32
E :Değişkenlerin beklenen değeri<br />
cov :Kovaryans<br />
2 2 2<br />
µ = E( X ) ve σ = E( X ) − E ( X ) olarak yazılabildiğinden, yukarıdaki eşitlik şu<br />
X<br />
X<br />
şekilde de yazılabilir:<br />
ρ<br />
X , Y<br />
=<br />
E( XY ) − E( X ) E( Y )<br />
E X − E X E Y − E Y<br />
2 2 2 2<br />
( ) ( ) ( ) ( )<br />
33<br />
(2.21)<br />
Korelasyon, standart sapma değerlerinin sıfırdan farklı ve sonlu olması durumunda<br />
hesaplanabilir. Birbiri ile ilintisi olmayan iki değişkenin korelasyon sonucu “0”dır.<br />
Benzerliğin alabileceği maksimum değer “1”dir.<br />
2.7.3 Destek Vektör Makineleri Ve Öğrenme Metodolojisi<br />
2.7.3.1 Lineer Öğrenme Makineleri<br />
Makinelerin öğrenebilme yetenekleri uzun yıllardan beridir insanların merakını alan<br />
bir konudur. Sistemlerin öğrenebilme yetenekleri, herhangi bir matematiksel modeli<br />
olmayan problemlerin çözümünde önemli bir yer tutmaktadır.<br />
2.7.3.1.1 Lineer Sınıflandırma<br />
n<br />
İkili sınıflandırma sıklıkla bir f : x ⊆ R → R gerçek-değerli fonksiyonu şu şekilde<br />
uygulanarak yapılır: x=(x1, x2, … , xn) girişi eğer f(x) ≥0 pozitif sınıfa, değilse<br />
negatif sınıfa atanmıştır. f(x), x ∈ X ’in bir lineer fonksiyonu ise,<br />
f ( x) = 〈 w. x〉 + b<br />
n<br />
∑<br />
f ( x) = w x + b<br />
i=<br />
1<br />
olarak yazılabilir.<br />
i i<br />
(2.22)
n<br />
Burada ( w, b) ∈ R * R parametreleri, fonksiyonu ve sgn(f(x)) ile verilen karar<br />
kuralını kontrol eder (sgn(0)=1). Öğrenme metodolojisi bu parametrelerin, veriden<br />
öğrenilmesi gerektiğini belirtir.<br />
Şekil 2.18 İki boyutlu eğitim seti için bir (w,b) ayırıcı hiperdüzlemi<br />
Bu tür bir varsayımın geometrik bir açıklaması X giriş uzayının +b = 0 eşitliği<br />
ile tanımlanan hiperdüzlem ile ikiye bölündüğüdür. Bir hiperdüzlem iki ayrı sınıfı<br />
barındıran uzayı ikiye böler. Şekil 2.18’deki hiperdüzlemin üst kısmı pozitif bölgeyi,<br />
alt kısmı ise negatif bölgeyi gösterir. X vektörü hiperdüzleme dikey bir yön tanımlar.<br />
b’nin değişen değeri hiperdüzlemi kendisine paralel taşır. w ve b nicelikleri nöral ağ<br />
literatüründeki gibi ağırlık vektörü ve bias (eğilim, verev) olarak kullanılacaktır.<br />
X giriş uzayını ve Y çıkış alanını gösterecektir. Genellikle<br />
34<br />
n<br />
x ⊆ R , ikili sınıflandırma<br />
için Y={-1,+1}, m-sınıflı sınıflandırma için Y={1, 2, … , m} ve regresyon için<br />
Y ⊆ R ’dir. Bir eğitim kümesi eğitim örneklerinden oluşmuştur ve bunlar eğitim<br />
verisi olarak adlandırılır. Genellikle<br />
(( , ),...( , )) ( * ) n<br />
S = x y x y ⊆ X Y<br />
(2.23)<br />
1 1<br />
n n<br />
olarak belirtilir. n : örnek sayısıdır.
xi’ler örnek, yi’ler ise etiketleri olarak gösterilir. S eğitim kümesi, eğer tüm<br />
örneklerin etiketleri eşit ise önemsizdir. Eğer x bir vektör uzayı ise giriş vektörleri<br />
ağırlık vektörleri olarak sütun vektörleridir.<br />
Bir (xi, yi) örneğinin sınırı (fonksiyonel), (w,b) düzlemi için<br />
γ = y ( 〈 w. x 〉 + b)<br />
(2.24)<br />
i i i<br />
şeklinde tanımlanır.<br />
γ > 0 , (xi, yi)’nin doğru sınıflandırmasını ifade eder. S eğitim kümesinin sınırı,<br />
i<br />
bütün hiperdüzlemlerin üzerindeki maksimum geometrik sınırdır. Bu en büyük<br />
değeri gerçekleştiren hiperdüzlem, en büyük sınır hiperdüzlemi olarak bilinir.<br />
Kendisinin sınırının boyutu, lineer ayrılabilen eğitim kümesi için pozitif olacaktır.<br />
2.7.3.1.2 Kernel Tabanlı Özellik Uzayı<br />
Kompleks gerçek-dünya uygulamaları lineer fonksiyonlardan daha anlamlı varsayım<br />
uzayları gerektirir. Kernel ifadeleri, lineer öğrenme makinelerinin hesapsal gücünü<br />
artırmak için veriyi yüksek boyutlu bir özellik uzayını düşürerek alternatif bir çözüm<br />
sunar. Lineer makinelerin ikili ifadedeki kullanımı bu adımı gerçekleştirmeyi<br />
mümkün kılar.<br />
2.7.3.1.3 Özellik Uzayları ve Kerneller<br />
Şekil 2.19, giriş uzayından özellik uzayına dönüşümü temel alan DVM’lerin temel<br />
fikrini göstermektedir.<br />
35
Giriş Uzayı Özellik Uzayı<br />
Şekil 2.19 Giriş uzayından özellik uzayına dönüşüm<br />
N<br />
Φ : R → F<br />
K( x, y) = ( Φ( x), Φ(<br />
y))<br />
36<br />
(2.25)<br />
Eğer F yüksek-boyutluysa yukarıdaki eşitliğin sağ tarafının hesabı çok uğraştırıcı<br />
olacaktır. Bununla birlikte hesabı verimli kılan kerneller mevcuttur. Örneğin<br />
polinomal kernel;<br />
K(x,y) = (x,y) d (polinomal kernel) (2.26)<br />
d=2 ve<br />
x, y R<br />
2<br />
2<br />
∈ için, örneğin ( x, y) ( ( x). ( x))<br />
2 2<br />
1 1 2 2<br />
= Φ Φ oluyorsa;<br />
Φ ( x) = ( x , 2 x x , x ) olacaktır. (2.27)<br />
Polinomal kernelin yanı sıra en çok kullanılan kerneller sigmoid kernel, RBF (Radial<br />
Basis Function) kernelleridir.<br />
K( x, y) = tanh( κ(<br />
x. y) + Ф))<br />
Sigmoid Kernel (2.28)<br />
2 2<br />
K( x, y) = exp( − || x − y || /(2 σ )) RBF Kernel (2.29)<br />
2.7.3.1.4 Özellik Uzayında Öğrenme<br />
Öğrenilecek hedef fonksiyonun karmaşıklığı gerçekleştirme yoluna dayanır ve<br />
bundan dolayı öğrenme işinin zorluğu değişir. İdeal olarak spesifik öğrenme
problemine uyan ifade seçilebilir. Dolayısıyla makine öğrenmesinde yaygın bir<br />
önişleme stratejisi verinin ifadesinde değişim içerir.<br />
x = ( x ,..., x ) → Φ ( x) = ( Φ ( x),..., Φ ( x))<br />
(2.30)<br />
1 n 1<br />
N<br />
(2.29) ifadesi X giriş uzayını yeni bir uzaya haritalamaya eşittir.<br />
F = { Φ( x) | x ∈ X}<br />
(2.31)<br />
Veriyi başka bir uzaya haritalamak, makine öğrenmesindeki işi çok basitleştirir ve<br />
verinin en iyi ifadesinin seçimi için teknik sayısını artırır. Veriyi anlatmak için<br />
tanıtılan nicelikler genellikler özellik olarak adlandırılır, en uygun ifadeyi seçme işi<br />
ise özellik seçimi olarak bilinir. X uzayı giriş uzayı olarak alınır ve<br />
F = { Φ( x) | x ∈ X}<br />
özellik uzayı olarak adlandırılır.<br />
Şekil 2.20 iki boyutlu bir giriş uzayından, iki boyutlu bir özellik uzayına haritalamayı<br />
gösteren bir örnektir. Veri giriş uzayında lineer bir fonksiyonla ayrılamazken, özellik<br />
uzayında ayrılabilir.<br />
Şekil 2.20 Sınıflandırma işini basitleştiren bir özellik haritası<br />
2.7.3.1.5 Vapnik ve Chervonenkis (VC) Teorisi ve VC Boyutu<br />
Lineer ve nonlineer DVM ifadelerinde, sınır (margin) ifadesinin büyük bir rol<br />
oynadığı görülür.<br />
φ(.)<br />
37<br />
φ( )<br />
φ( )<br />
φ( ) φ( )<br />
φ( ) φ( ) φ( )<br />
φ( )<br />
φ( ) φ( )<br />
φ( )<br />
φ( )<br />
φ( ) φ( )
VC boyutu genellikle h ile ifade edilir. VC boyutu sınıflandırma fonksiyonlarının<br />
kapasitesini ölçer. Fonksiyonlar kümesi için bir VC boyutu h ile parçalanan eğitim<br />
örneklerinin maksimum sayısı olarak tanımlanır.<br />
iF ( x, w) ∈ {0,1} ya da iF ( x, w) ∈{ − 1,1}<br />
(2.32)<br />
iF gösterge fonksiyonlarını belirten bir ifadedir. İki sınıflı sınıflandırma işlemlerinde<br />
i ( x, w ) gösterge fonksiyonlarının bir kümesinin VC boyutu, bütün olağan<br />
F<br />
durumlarda ayrılabilecek noktaların en büyük h sayısını gösterir. İki sınıflı örüntü<br />
tanıma problemlerinde, n tane nokta kümesi 2 n mümkün yolla etiketlenebilir. Eğer<br />
kümenin üyeleri, bütün etiketleri doğru olarak işaret ediyorsa, bu fonksiyonlar<br />
kümesinin VC boyutu h=n’dir<br />
İki boyutlu sınıflandırma problemlerinde, R 2 (x1,x2) özellik uzayında, hiperdüzlemin<br />
bir tarafındaki bütün noktalar +1, diğer tarafındaki noktalar da -1 değerini alır.<br />
Üç noktanın bir hiperdüzlem tarafından nasıl ayrıldığı 2 3 =8 şeklinde hesaplanır.<br />
Bir n-boyutlu giriş uzayında, yönlü hiperdüzlem gösterge fonksiyonunun VC boyutu<br />
h=n+1 (2.33)<br />
olarak hesaplanır.<br />
VC boyutu istatistiksel öğrenme teorisindeki bütün sonuçlarda kullanılır. Kolay bir iş<br />
değildir. Bu nicelik, spesifik tahmin fonksiyonuna ve çözülecek öğrenme<br />
probleminin tipine bağlıdır (sınıflandırma veya regresyon problemlerinden biridir).<br />
2.7.3.1.6 Langrangian Teorisi<br />
Langrangian teorisinin amacı başlangıçta hiçbir eşitsizlik sabiti olmayan bir<br />
optimizasyon probleminin çözümünü karakterize etmektedir. Bu teorinin ana<br />
38
konsepti Langrangian çarpanları ve Langrangian fonksiyonudur. Bu metot 1797’de<br />
mekaniksel problemler için Langrange tarafından geliştirilmiştir.<br />
f(w) amaç fonksiyonlu ve hi(w)=0, i=1,…,m eşitlik sabitli verilen bir optimizasyon<br />
problemi için<br />
m<br />
L( w, β ) = f ( w) +∑ β h ( w)<br />
(2.34)<br />
i=<br />
1<br />
i i<br />
Langrangian fonksiyonudur ve β i katsayılarını Langrangian çarpanları olarak<br />
adlandırılır.<br />
2.7.3.2 Destek Vektör Makineleri (Support Vector Machines)<br />
Destek Vektör Motoru - DVM bir öğrenme algoritması olarak Vapnik tarafından<br />
geliştirilen İstatiksel Öğrenme Teorisi (Vapnik, 1998) nin bir uygulaması olarak<br />
ortaya çıkmıştır. DVM’ler yapısal risk minimizasyon prensibi etrafında<br />
formülleştirilmiştir. Beklenen riskin üst sınırını küçüklemeye çalışır.<br />
Destek Vektörü öğrenme iki bakımdan çok kullanışlıdır. Birincisi Destek Vektörü<br />
öğrenme basit fikirler üzerine kurulmuştur. İkincisi yüksek performanslı pratik<br />
uygulamalarda kullanılabilir (Yıldırım, 2006).<br />
DV algoritması öğrenmesi teorisinin ve pratiğinin kesiştiği bir uygulamadır; bazı<br />
belirli algoritma tipleri için istatistiksel öğrenme teorisinde hesaplamaların başarılı<br />
olması için faktörler tam olarak istenir. Gerçek dünya uygulamaları, sık sık teorik<br />
olarak çözülmesi zor ve kompleks olan uygulamalardır. DV algoritması iki zorluğu<br />
da basitçe kaldırabilir. Yeterince kompleks olan modellere çözüm getirebilir.<br />
Matematiksel olarak analizi basittir, çünkü nonlineer giriş uzayındaki verileri<br />
dönüşümler yaparak özellik uzayına düşürür ve çözüm kolaylaşır.<br />
39
Özellikle iki sınıflı sınıflandırma probleminde DVM iki sınıf arasındaki sınırı<br />
büyükleyen optimal ayırt etme yüzeyini belirlemekte, yani eğitim kümesi ile ayırt<br />
etme yüzeyine en yakın noktaların arasındaki mesafeyi en büyüklemektir. Ayrıca,<br />
optimal ayırt etme yüzeyi, destek vektörleri olarak adlandırılan veri noktaların küçük<br />
bir kümesinde merkezlenmiş kernel fonksiyonların doğrusal bir kombinasyonu<br />
olarak ifade edilmektedir. Genelde destek vektörleri çok az miktarda olduğu için<br />
optimal ayırt etme yüzeyinin gösterimi seyrektir, bir anlamda veri noktalarının<br />
sadece bir bölümü sınıflandırma görevi ile ilgilidir. Buna ilaveten, doğrusal<br />
kombinasyon katsayıları doğrusal eşitsizlik ve kısıtları dahilinde bir konveks ikinci<br />
dereceli (quadratic) programlama probleminin çözümü ile belirlenmektedir. Çok<br />
katmanlı perseptron ve radyal tabanlı ağlar, uygun çekirdek fonksiyonları ile elde<br />
edilen DVM ağların özel durumları olarak gösterilebilir.<br />
2.7.3.2.1 En Büyük Sınırlı Sınıflandırma ve Lineer Destek Vektör Makineleri<br />
DVM’lerin en basit modeli en büyük sınırlı sınıflandırma olarak bilinmektedir.<br />
DVM’lerin bu kısmı sadece lineer olarak ayrılabilen özellik uzayı için geçerlidir. Bu<br />
nedenle, çoğu gerçek-dünya uygulamalarında kullanılması oldukça zor bir<br />
yöntemdir. Ama anlaşılması en kolay algoritmadır ve daha karmaşık DVM için temel<br />
kısmı inşa etmektedir. DVM için geçerli olan çoğu anahtar özellikleri içinde<br />
bulundurur.<br />
Giriş verilerinin kernel fonksiyonlarından geçirilip özellik uzayına düşürülmesi gerek<br />
yoktur. Sadece verileri birbirinden en iyi şekilde ayıran ve en büyük sınırlı<br />
sınıflandırmayı yapan hiperdüzlemi bulmak yeterli olacaktır.<br />
Hiperdüzlem tarafından ayıran veriler x + ve x - ise<br />
+<br />
〈 w. x 〉 + b = + 1<br />
(2.35)<br />
−<br />
〈 w. x 〉 + b = − 1<br />
(2.36)<br />
40
Sınıflandırıcının sınırı γ ile gösterilecek olursa;<br />
1 ⎛ w w ⎞<br />
+ −<br />
γ = ⎜ . x − . x<br />
2 ⎜<br />
⎟<br />
|| w || || w || ⎟<br />
1 1<br />
⎝ 2 2 ⎠<br />
1<br />
+ −<br />
= ( w. x − w. x )<br />
2 || w ||<br />
2<br />
2<br />
41<br />
(2.37)<br />
1<br />
= ifadesi geometrik sınırı verecektir. (2.38)<br />
|| w ||<br />
S = (( x , y ),...,( x , y )) ile verilmiştir bir lineer olarak ayrılabilen eğitim kümesinde<br />
n n<br />
optimizasyon problemini çözen (w,b) hiperdüzlemi en büyük değerli sınırlı<br />
hiperdüzleminde geometrik sınırı γ = 1/ || w || 2 olarak hesaplanır.<br />
2.7.3.2.2 Lineer Ayırt Edilebilir Sınıflar<br />
N boyutlu bir {( )} 1<br />
N<br />
S = x + y eğitim kümesi verilmiş olsun, burada i=1, 2 ,…, N<br />
i i i=<br />
için<br />
x R<br />
n<br />
i ∈ ve i<br />
y ∈{ − 1, + 1} . Diğer değişle, S’teki örneklerin iki sınıftan birine ait<br />
olduğu varsayılmıştır. Bununla beraber sınıfların hiperdüzlemin aynı tarafındaki bir<br />
sınıfın bütün elemanlarının yer aldığı bir hiperdüzlem ile ayırt edilebildiği kabul<br />
edilmiştir. Amaç iki sınıfı ayıran hiperdüzlemin eşitliğini bulmaktadır. Sınıflandırma<br />
için DVM yapısında çözümü zorlayan kısıt, optimal ayırt etme yüzeyinin eğitim<br />
kümesine en yakın noktalar ile birlikte mesafeyi büyüklemek zorunda olmasıdır. Bu<br />
kavramları daha anlaşılır hale getirmek amacıyla bir takım tanımlara ihtiyaç vardır.<br />
Eğer<br />
n<br />
w∈ R ve w∈ R olursa, aşağıdaki durumları sağlayacak şekilde S kümesi<br />
doğrusal olarak ayrılabilir:<br />
i 1,2,..., N<br />
= için ( )<br />
y w.x + b ≥ 1<br />
(2.39)<br />
i i<br />
(w,b) çiftinin w.x+b = 0 eşitliğine ait ayırt etme hiper uzayını tanımlamaktadır. di,<br />
ayırt etme hiper uzayından xi noktasına kadar olan mesafeyi göstersin:
d<br />
i<br />
( w. x + b)<br />
i<br />
= (2.40)<br />
|| w ||<br />
burada ||w|| sembolü, w’nin normunu göstermektedir. Böylece bütün xi ∈ S ’ler için<br />
aşağıdaki eşitsizlik sağlanır:<br />
1<br />
≤ yidi (2.41)<br />
|| w ||<br />
yi di her zaman pozitif bir niceliktir. Buna ilaveten, 1/||w||, xi noktaları ve ayırt etme<br />
hiperdüzlemi (w,b) arasındaki mesafenin alt sınırıdır; yani S noktaları ve en az<br />
1/||w||’ye eşit olan ayırt etme hiperdüzlemi arasındaki mesafedir.<br />
Doğrusal bir şekilde ayrılabilen S kümesi için optimal ayırt etme hiperdüzlemi, S’e<br />
ait en yakın noktanın mesafesini en büyükleyen hiperdüzlemdir.<br />
Optimal ayırt etme hiperdüzlemi ve S’e ait en yakın nokta arasındaki mesafe 1/||w||<br />
olduğu için optimal ayırt etme hiperdüzlemi, 1/||w|| niceliğini en büyükleyen S için<br />
ayırt etme hiperdüzlemi olarak yorumlanabilir.<br />
1/||w||’nin en büyüklenmesi, ||w||’nin en küçüklenmesine eşit olduğu için bu<br />
problemin çözümü S’in optimal ayırt etme hiperdüzlemine eşittir. 2/||w|| niceliği<br />
sınıflar arsındaki sınır olarak adlandırılır ve optimal ayırt etme hiper yüzeyi sınırı en<br />
büyükleyen hiperdüzlem olarak yorumlanabilir. Sınır, S kümesinin ayırt edilebilirlik<br />
ölçütüdür veya diğer bir değişle sınıflandırma problemlerinin karmaşıklığının bir<br />
ölçütüdür.<br />
42
Şekil 2.21 Sınır değerleri<br />
Lineer olarak ayrılabilen durumlarda, sınıfları birbirinden ayıracak birkaç<br />
hiperdüzlem bulunabilir. Önemli olan bu hiperdüzlemler içinde en iyisini<br />
seçebilmektedir. Lineer olarak ayrılabilen verilen sınıflandırılması durumunda, bütün<br />
hiperdüzlemler içinde eğitim arızasını minimize eden, en büyük sınır değerine sahip<br />
olan hiperdüzlem seçilir. Büyük değerli sınıra sahip olmayan hiperdüzlemin<br />
beklenen riski yüksek olacaktır.<br />
2.7.3.2.3 Lineer Olarak Ayırt Edilemeyen Sınıflar<br />
Gerçek hayatta karşılaşılan çoğu problemler ya lineer ya da nonlineer durumlarda<br />
ayırt edilemez. Genellikle mümkün olduğu kadar sınıfları ayırabilen giriş kümeleri<br />
bulmaya çalışır, fakat çoğunlukla ilgili girişler kayıptır, veri tam değildir, güvenilir<br />
değildir veya gürültülüdür.<br />
Doğrusal olarak ayırt edilebilen sınıflar hipotezi pratik uygulamalar için oldukça<br />
sınırlıdır. Bu nedenle önceki sonuçları düzenlemeye gerek vardır. Bu durum,<br />
y ( w. x + b) + ξ < 1 ifadesini sağlayacak şekilde bir takım ( x , y ) ∈ S noktalarının var<br />
i i i<br />
Sınır<br />
w.x+b = -1<br />
w.x+b = +1<br />
w.x+b = 0<br />
olduğu anlama gelir. Negatif olmayan bir ξ i serbestlik değişkeninin girilmesi<br />
43<br />
i i
y ( w. x + b)<br />
≥ 1 ile aynı formda doğru şekilde sınıflandırılmamış bir nokta için kısıt<br />
i i<br />
belirtmeye ve doğrusal olarak ayırt edilemeyen eğitim kümesi durumunda önceki<br />
analizleri genişletmeye izin verir. Bu amaçla, aşağıdaki ifadeyi sağlayacak şekilde N<br />
adet negatif olmayan serbestlik değişkeni (S’deki her nokta için) ξ = ( ξ1 + ξ2 + ξN<br />
)<br />
verilirse;<br />
y ( w. x + b) + ξ ≥ 1 i=1,2,…,N, (2.42)<br />
i i i<br />
xi noktası doğru bir şekilde sınıflandırılmış ise ξ i =0 eşitliğine göre<br />
y ( w. x + b) + ξ ≥ 1’dir<br />
ve y ( w. x + b) + ξ ≥ 1 kısıtı y ( w. x + b)<br />
≥ 1’e<br />
dönüşür. xi<br />
i i i<br />
i i i<br />
44<br />
i i<br />
noktası doğru bir şekilde sınıflandırılmamış ise y ( w. x + b) + ξ ≥ 1’in<br />
sağlanması<br />
i i i<br />
için serbestlik değişkenine uygun şekilde bir ξ i >0 değeri varsayılacaktır.<br />
Lineer metottan, nonlineer tekniğe geçişi yapabilmek için Vapnik verisini çok<br />
boyutlu özellik uzayına haritalamayı gerçekleştirmiştir. Giriş değerleri özellik<br />
uzayına düşürülerek lineer ayırıcı hiperdüzlem yapılmıştır.<br />
( )<br />
K x,z = Φ( x). Φ ( z)<br />
uygulaması sıklıkla kernel oyunu diye adlandırılır. Bu bize<br />
kesin hesaplamalar yapmadan çok boyutlu özellik uzayında çalışma kolaylığı sunar.<br />
Bu kernel oyununu uyguladıktan sonra hesaplamalar başka uzayda gerçekleştirilir.<br />
DVM’lerde Φ (.) dönüşümleri yapılarak çok boyutlu özellik uzayında<br />
formülasyonlar yapılır.<br />
2.7.3.2.4 Nonlineer Destek Vektör Makineleri Sınıflandırıcıları<br />
Lineer Destek Vektör Makineleri Sınıflandırıcılarından nonlineer DVM<br />
sınıflandırıcılara genişletme basittir. X ile<br />
kernel oyunu uygulanabilir.<br />
Φ( x)<br />
biçimsel olarak yer değiştirebilir ve
Nonlineer DVM’leri dizayn etmek için temel fikir, giriş uzayındaki verileri yüksek<br />
boyutlu özellik uzayına düşürmektedir.<br />
x ∈ R → z( x) = [ a φ ( x), a φ ( x)..., a φ ( x)] ∈ R<br />
Yukarıdaki gösterimde<br />
n T f<br />
1 1 2 2<br />
n n<br />
n f<br />
R → R ’e bir dönüşüm gösterilmiştir. Bir φ ( x)<br />
eşleştirmesi<br />
önceden seçilen, sabit bir fonksiyondur. Bir x-giriş uzayı, x giriş vektörünün xi<br />
bileşenlerinden oluşur ve bir f-özellik uzayı (z-uzayı) z vektörünün i ( ) x φ<br />
bileşenlerinden oluşur. Bu dönüşüm yapıldıktan sonra z- uzayında lineer algoritma<br />
uygulanarak çözüme ulaşılması beklenilir.<br />
Bir x-giriş uzayından, yüksek dereceli z-uzayına düşürme işleminde iki problemle<br />
karşılaşabiliriz: φ ( ) eşleştirmesinin seçimi ve eğer f özelliklerinin sayısı çok fazla<br />
i x<br />
T<br />
ise hesaplanması gözü korkutan bir z ( x). z( x ) skaler çarpımının hesaplama<br />
işlemidir. Bu işlemlerden de kurtulabilmenin yolu kernel fonksiyonlarının<br />
kullanımıdır.<br />
T<br />
Bir özellik uzayındaki φ ( x ). φ ( x ) skaler çarpımlarını, herhangi bir kernel<br />
i j<br />
fonksiyonu seçildikten sonra K(xi, xj) hesaplamasını yaparak bulabiliriz. Bu çok<br />
uğraştırıcı bir işlem değildir.<br />
En çok kullanılan kernel fonksiyonları şunlardır:<br />
( , ) ( . ) d<br />
K x y = x y polinomal kernel (2.43)<br />
K( x, y) = tanh( κ(<br />
x. y) + Ф)<br />
) sigmoidal kernel (2.44)<br />
2 2<br />
K( x, y) = exp( − || x − y || /(2 σ )) RBF Kernel (2.45)<br />
Nonlineer durumlarda da Langrange çarpanlarını kullanıp gerekli işlemler yapılır ve<br />
özellik uzayına düşürülen veriler sınıflandırılır.<br />
45
1<br />
L y y z z<br />
n n<br />
T<br />
d ( α) = αi − i jαiα j i j<br />
i= 1 2 j=<br />
1<br />
∑ ∑ (2.46)<br />
n n 1<br />
L ( α) = α − y y α α K( x , x )<br />
∑ ∑ (2.47)<br />
d i i j i j i j<br />
i= 1 2 j=<br />
1<br />
Burada αi ≥ 0 , i=1, … , n ve<br />
n<br />
∑<br />
i=<br />
1<br />
α y = 0 ’dir.<br />
i i<br />
2.7.3.2.5 Çok Sınıflı Sınıflandırma<br />
DVM’ler aslında ikili sınıflandırıcılardır. Sadece iki sınıfı birbirinden ayırmak için<br />
tasarlanmışlardır. Bununla birlikte, çoğu gerçek uygulamalarda, çok-sınıflı<br />
sınıflandırma gerekmektedir.<br />
Bir çözüm çok-sınıflı bir problemi birkaç 2-sınıflı probleme ayrıştırmak,<br />
sınıflandırıcıları bu problemleri çözmek için eğitmek ve çıkış için bunları tekrar<br />
yapılandırmaktır. En kolay çok-sınıflı sınıflandırma yapılarından biri birine-karşı-<br />
diğerleri yaklaşımıdır. Bu metotta, K sınıflandırıcı, her sınıflandırıcı diğerlerinden bir<br />
sınıf ayıracak şekilde oluşturulmuştur. Bununla birlikte, çoğu uygulamalarda, bu<br />
yaklaşım diğerlerine göre alt seviye kalmaktadır.<br />
İkişerli sınıflandırıcıların çözümlerinin çıkışlarından son sınıflandırma çözümünü<br />
yapılandırmak için çeşitli planlar vardır. En basit metotlar çoğunluk oylamasına<br />
bakar. İkişerli sınıflandırıcılar sınıflar için oylar verir ve en çok oyu alan sınıf dikkate<br />
alınan örnek için son karar sınıfı olarak seçilir. Eğer tekrar oluşturma kullanılmışsa,<br />
sınıflandırıcılar sadece ikili oylar (-1 ya da 1) kullanılabilir, fakat yumuşak<br />
oluşturmada sınıflandırıcıların kesin çıkışları oy olarak göz önüne alınmıştır. DVM<br />
tabanlı bir sınıflandırıcının kesin çıkışı ne kadar yüksekse, sınıflandırılacak örnek<br />
pozitif sınıfa aittir ve çıkış ne kadar küçükse örnek negatif sınıfa aittir. Eğer çıkış<br />
sıfıra yakınsa sınıflandırma kararı güvenilmezdir.<br />
46
Çoğunluk oylaması uygularken önemli bir problem meydana gelir. Verilen bir x<br />
örneği için, oylama planı bütün çift sınıflandırıcıların çıkışlarını değerleri dikkate<br />
alınmadan eşit olarak ağırlıklandırır. Tabi ki, sınıflandırıcının başarısıyla ilgilenen<br />
konu ile ilgili sınıflandırıcılar gelişmede bilinmemektedir. Bununla birlikte, bazı çift<br />
sınıflandırıcıların fazlalığı bir karışım matrisiyle birlikte düşünülebilir. Bu yaklaşımla<br />
birlikte, sınıflandırıcıların çıkışları karışım matrisiyle lineer olarak birleştirilir.<br />
2.7.3.2.6 Bire-karşı-biri Metodu<br />
Bu metotta k tane sınıf varsa eğer k.(k-1)/2 tane sınıflandırıcı yapılandırılır ve<br />
aşağıdaki ikili sınıflandırma problemi çözülür.<br />
min<br />
ij ij<br />
w , b<br />
1 ij T ij ij ij<br />
( w ) w + C∑ ξn<br />
( w ) T<br />
(2.48)<br />
2<br />
t<br />
ij T ij ij<br />
( w ) φ( x ) + b ≥ 1−<br />
ξ , eğer yn=i ise (2.49)<br />
n n<br />
ij T ij ij<br />
( w ) φ( x ) + b ≤ 1−<br />
ξ eğer yn=j ise (2.50)<br />
n n<br />
Bütün M tane sınıflandırıcının yapılandırılmasından sonra bir sonraki testi yapmak<br />
için farklı metotlar vardır.<br />
2.7.3.2.7 Bire-karşı-diğerleri Metodu<br />
Bu metotta da, k sınıflı bir problem için k tane ikili sınıflandırıcı oluşturulur. i.<br />
sınıftaki veriyi pozitif etiketli, diğerlerini negatif etiketli olarak alır. i. DVM<br />
aşağıdaki problemi çözer.<br />
min<br />
ij ij i<br />
w , b , ξ<br />
1 i T i i<br />
( w ) w + C∑<br />
ξ j<br />
(2.51)<br />
2<br />
t<br />
i T i<br />
( w ) φ( x j ) + bi<br />
≥1 − ξ j , eğer y = i ise (2.52)<br />
i<br />
i T i<br />
( w ) φ( x j ) + bi<br />
≤ − 1+<br />
ξ j , eğer y ≠ i ise (2.53)<br />
i<br />
47
3. MATERYAL VE YÖNTEM<br />
Plaka tanıma uygulaması MATLAB® programı kullanılarak gerçekleştirilmiştir.<br />
Mathworks firması tarafından geliştirilen bu program, MATrix LABoratory<br />
kelimelerinin kısaltılmasıdır. MATLAB hazır fonksiyonlar ve programlama yoluyla<br />
birçok alandaki yoğun matematiksel algoritma ve işlemlerin gerçekleştirilmesini<br />
sağlayan bir matematiksel çözüm platformudur. MATLAB, görüntü işleme<br />
gereçlerinin yanı sıra kontrol sistemleri, haberleşme, yapay sinir ağları, istatistik gibi<br />
birçok alanda uygulama geliştirmeye imkân sağlamaktadır.<br />
Değişik mekânlarda rasgele seçilen yaklaşık 200 adet aracın 340 adet görüntüsü<br />
dijital kamerayla jpg formatında kaydedilmiştir. Görüntüler plakanın işlenebilirliği<br />
göz önünde tutularak yaklaşık 2-5m mesafeden alınmıştır. Çalışmada kullanılan<br />
görüntüler, günün farklı saatlerinde, farklı açılardan çekilmesine önem verilmiştir.<br />
Bunun için tasarlanan program ile plaka bilgisi, giriş olarak verilen görüntüden<br />
çıkışta değişik platformlarda kullanılmaya hazır metin bilgisine çevrilmektedir. Plaka<br />
tanıma üç ana başlık altında ele alınmıştır.<br />
• Plaka Bölgelerinin Bulunması,<br />
• Karakterlerin Ayrıştırılması,<br />
• Karakterlerin Tanınması.<br />
3.1. Plaka Bölgesinin Bulunması<br />
Bu çalışmada şimdiye kadar denenen yöntemlere alternatif olarak farklı bir yöntem<br />
denenmiştir. Uyguladığımız yöntem ile hem özel ve resmi plaka tarzları hem de kare<br />
(çift satırlı) tarzı plakalar saptanmıştır. Bu aşamada uygulanan adımlar Şekil 3.1’ de<br />
gösterilmiştir.<br />
48
Top-hat<br />
Dönüşümü<br />
Görüntü işleme birimi<br />
Doldurma<br />
+<br />
Eşikleme<br />
.<br />
Şekil 3.1 Plaka bölgesinin bulunması<br />
Şekil 3.2.a’da orijinal görüntü ve Şekil 3.2.b’de Top-hat dönüşümü uygulanmış<br />
görüntü gösterilmiştir. Şekil 3.2’de görüldüğü gibi arabanın beyaz olması plaka<br />
bölgesinin ayrıştırılması herhangi bir dezavantaja yol açmamaktadır. Düz olan<br />
bölgeler yani arka plan ile zıtlık içermeyen bölgeler, koyu renge dönüşmüştür.<br />
Burada da görülebileceği gibi plaka bölgesi olduğu gibi kalmıştır.<br />
Şekil 3.2 (a) Giriş görüntü, (b) Top-hat dönüşümü<br />
49<br />
Kontrol Birimi<br />
Etiketleme Aday plaka<br />
bölgeleri
Şekil 3.3 Resmi plakaya uygulanan koyu nesneler için Top Hat dönüşümü<br />
Şekil 3.3’de resmi bir plakaya sahip görüntüye koyu nesneler için top-hat dönüşümü<br />
(bknz.bölüm 2) uygulanmış görüntü gösterilmiştir. Şekil 3.3’de görüldüğü gibi beyaz<br />
karakterler siyah karakterlere, arka planda beyaza dönüşmüştür. Dolayısıyla burada<br />
bu görüntüde elde edilen plaka bilgisi Şekil 3.2’de elde edilen plaka bilgisiyle aynı<br />
özelliğe sahip olmaktadır. Bundan dolayı sonraki aşamalarda faklı plaka tarzları için<br />
farklı işlemler uygulanmasına gerek kalmamıştır.<br />
TopHat dönüşümünden sonra doldurma işlemi ile plaka bölgesinde bulunan<br />
karakterler doldurularak plaka bölgesi bütün olarak elde edilir (Şekil 3.4.b). Bu<br />
sayede plakayı içine alan bir bölge oluşturulmuş ve bu bölgenin içi tamamen<br />
doldurulmuş olur. Bu yöntem, çift satırlı (motorsiklet v.s) plakaların yerini bulmakta<br />
oldukça kolaylık sağlar (Şekil 3.4).<br />
(a) (b)<br />
50
(c)<br />
Şekil 3.4 (a) Orijinal görüntü, (b) Top hat dönüşümü ve doldurma işleminin<br />
uygulanmış hal, (c) ikilik seviyedeki görüntü<br />
Doldurma işleminden sonra gri düzeye sahip görüntü, otsu eşikleme yöntemi ile ikili<br />
imge haline çevrilir ve plaka bölgesi olamayacak kadar küçük alanlar silinir (Şekil<br />
3.5).<br />
Şekil 3.5 İkilik seviyedeki görüntü<br />
3.1.1 Bölgelerin Etiketlenmesi<br />
Elde edilen ikili görüntüye etiketleme işlemi uygulanarak her öbek ayrı bir renk ile<br />
etiketlenir (Şekil 3.6). Bölgelerin sınıflandırılabilmesi için birbirileri ile komşu olan<br />
noktaların etiketlenmesi açısından önem taşır.<br />
51
Şekil 3.6 Etiketlenen görüntü<br />
En sol üst köşeden başlanarak, birbiriyle temas etmeyen bütün bölgeler<br />
numaralandırılır. Bundan sonra yapılacaklar her işlemde, bölgeler bu etiketleri<br />
yardımıyla işlenecektir.<br />
Etiketlenen her bölgenin boy, genişlik, alan, en-boy oranı ve görüntü içerisindeki<br />
koordinat bilgileri bulunur. Bu bilgiler kullanılarak plaka bölgesi olabilecek aday<br />
bölgeler belirlenir. Plaka bölgesinin plaka özelliği taşıyıp taşımadığına kural tabanlı<br />
çalışan bir yöntemle karar verilir.<br />
3.1.2 Aday Plaka Bölgelerin Sağlaması Gereken Koşullar<br />
Plaka bölgesi olabilecek bölgeler, belirli bir en boy oranına sahip olması gerekir. Bu<br />
bölgelerin en-boy oran kriteri incelenerek dikdörtgensel veya kare bir alan olup<br />
olmadığını kontrol edilir. En ve boy uzunluğunun 2-5m mesafeden çekilen<br />
fotoğraflarda belirli ölçülerde olmasından dolayı, plakanın işlenebilirliği göz önünde<br />
tutularak plakanın genişliği 12, boyu 40 pikselden az olmamalıdır. Daha az olması<br />
durumunda plaka karakterlerin belirsiz olacağından tanımlanması çok zordur.<br />
Plakanın özelliklerini, sabit arka plan üzerinde yüzen, birbirine benek komşuluğu<br />
olmayan ve arka planda yüksek kontrasta sahip, genellikle aynı ebatlardaki karakter<br />
ve rakamlardan oluşmuş dikdörtgensel veya kare alan olarak ifade edebiliriz<br />
52
Plaka olabilecek bölge belirlendikten sonra, bu bölgenin içinde yer alan karakter<br />
sayısını ve özellikleri inceleyerek bulunan bölgenin plaka bölgesi olup olmadığı<br />
tespit edilir. Çoklu karakter kriteri nedeniyle doğruluk oranı yüksektir.<br />
(a) (b)<br />
Şekil 3.7 (a) Aday plaka bölgesi, (b) Etiketleme<br />
Her bir olası plaka bölgesi için, Şekil 3.7.b’de görüldüğü gibi etiketleme işlemi<br />
uygulanır. Her bir karakter için, karakter öznitelikleri elde edilir.<br />
Karakter öznitelikleri;<br />
• Karakterler arası uzaklık<br />
• Karakter alanı<br />
• Yüksekliği<br />
• Sayısı<br />
• Genişliği<br />
• Yerleşkesi<br />
Bu özellikler kullanılarak plaka bölgesi olabilecek bölgeler için son karar<br />
verilmektedir. Beyaz fon üzerindeki, siyah karakterlerin sorgulandığı bu aşamada;<br />
üçten fazla karakter bölgesi olması durumunda bölge, plaka bölgesi olarak belirlenir.<br />
Yeterli şartlara uymayan ve yeterli karakter içermeyen aday plaka bölgeleri elenir.<br />
Plaka olma kurallarına uyan tüm bloklar plaka bölgeleri olarak adlandırılır. Bundan<br />
sonraki işlemler bulunan bütün bölgeler için uygulanır. Dolayısıyla bir görüntünün<br />
içinde birden fazla araç varsa hepsinin de plakalarının tanımlanması amaçlanmıştır.<br />
53
3.1.3 Plaka Bölgesinin Yatayla Paralel Hale Getirilmesi<br />
Bulunan plaka bölgesi, her zaman düzleme paralel olmayabilir. Düzleme paralel<br />
olmayan görüntüden, karakterleri ayrıştırma işleminin başarısı önemli ölçüde<br />
azalacaktır.<br />
Şekil 3.8 Plakası bulunacak görüntü<br />
Şekil 3.9 Bulunan plaka bölgesi<br />
Bulunan plaka bölgesine hough dönüşümü uygulanır (Şekil 3.9).<br />
54
ρ<br />
-150<br />
-100<br />
-50<br />
0<br />
50<br />
100<br />
150<br />
Şekil 3.10 Hough dönüşümü<br />
-50 0<br />
θ<br />
50<br />
Şekil 3.11 Plaka bölgesinin eğriliğin tespiti<br />
Hough dönüşümü ile görüntüdeki en belirgin çizgi dikkate alınarak, yatay eksenle<br />
oluşturduğu açı değeri ( Θ ) belirlenir.<br />
Şekil 3.12 Shear dönüşümü<br />
55
Shear dönüşümü (3.1) denklemi kullanılarak plaka bölgesi düzlemle paralel hale<br />
getirilir.<br />
S<br />
r<br />
⎡1 r 0⎤<br />
=<br />
⎢<br />
0 1 0<br />
⎥<br />
⎢ ⎥<br />
⎢⎣ 0 0 1⎥⎦<br />
Burada r = tan( Θ ) ’dir<br />
Şekil 3.13 Shear dönüşümü uygulanmış plaka bölgesi<br />
3.1.4 Plaka Çerçevesinin Çıkarılması<br />
56<br />
(3.1)<br />
Bulunan plaka görüntüsü gri seviyeye dönüştürüldükten sonra otsu eşikleme yöntemi<br />
kullanılarak ikilik görüntü elde edilir. Böylece arkalan beyaz ve karakterler siyah<br />
olarak ayrıştırılmış olur. Plaka bölgesi, plakaya ait karakterleri/rakamları karakter<br />
tanımlamada en yüksek başarım verecek şekilde ayrıştırmak gerekir. plaka<br />
çerçevesinin çıkarılması ve sadece karakter bilgisinin kalması için yatay ve düşey<br />
izdüşümden faydalanılmıştır (Şekil 3.14).
(a) (b)<br />
Şekil 3.14 Plaka çerçevesinin çıkarılması için dikey (a) ve yatay (b) izdüşüm<br />
Şekil 3.14’de gösterilen düşey izdüşüm değerlerinin ortalaması hesaplanır.<br />
İzdüşümün başından ve sonundan başlanarak bu ortalama değere yaklaştığı kısımdan<br />
önceki ve sonraki alanlar çıkarılır. Şekil 3.14’deki yatay izdüşümden görüldüğü gibi<br />
yatay düzleme paralel olduğundan iki minimum değer arasında kalan kısım plaka<br />
karakterlerini içereceğinden diğer kısımlar silinir. Böylelikle plaka bölgesinden,<br />
plaka çerçevesi ayrıştırılarak Şekil 3.15’de görülen plaka karakterleri elde edilmiş<br />
olur.<br />
Şekil 3.15 Plaka karakterlerini içeren görüntü<br />
57
3.2. Karakterlerin Ayrıştırılması<br />
Plaka bölgesi bulunmasının ardından, karakterler ayrıştırılarak tanıma işlemine hazır<br />
hale getirilmesi gerekmektedir. Karakterlerinin doğru bir şekilde ayrıştırılması için,<br />
plaka bölgesine ait görüntü normalize edilir.<br />
3.2.1 Plakanın Normalize Edilmesi<br />
Bulunan ve düzleme paralel hale getirilen plaka bölgesinde, karakterlerinin<br />
ayrıştırılabilmesi için plakanın belirli bir ebada getirilmesi gerekir. Yapılan<br />
denemeler sonucu 40x180 matrisin yeterli olduğu görülmüştür. Daha büyük olması<br />
çözünürlüğü artıracaktır ancak, işlem sayısını artıracaktır. Gerekenden küçük olması<br />
ise çözünürlük çok azaltacağından karakterlerin ayırt edici özellikleri kaybolacaktır.<br />
Şekil 3.16 [40 180] ebadında normalize edilmiş görüntü<br />
Şekil 3.17 [20 100] ebadında normalize edilmiş görüntü<br />
Şekil 3.18 [15 80] ebadında normalize edilmiş görüntü<br />
Karakterlerin ayrıştırılması için normalize edilen plaka bölgesinin tersi alınır. Şekil<br />
3.19’da gösterildiği gibi dikey doğrultudaki izdüşüm bilgisi kullanılır.<br />
58
40<br />
35<br />
30<br />
25<br />
20<br />
15<br />
10<br />
5<br />
0<br />
0 20 40 60 80 100 120 140 160 180<br />
Şekil 3.19 Karakterlerinin izdüşümü<br />
Şekil 3.19‘daki karakterlerin izdüşümü grafiğinden vadi ve tepeler tespit edilerek,<br />
minimum değerler arasında kalan genişlik ve yükseklik değerleri dikkate alınır ve<br />
karakter olabilecek kısımlar belirlenir. Belli bir eşik değer altında olan kısımlar<br />
gürültü kabul edilir (Şekil 3.20).<br />
Şekil 3.20 Karakter olmayan bölgelerin silinmesi<br />
59
Hesaplanan karakter genişliği 30’dan büyük ise iki karakterin birleştiğine karar<br />
verilerek ayrıştırma işlemi uygulanır. Şekil 3.21’deki gibi dikey izdüşümünden<br />
faydalanarak belli bir aralıkta, birleşmenin minimum noktasından bölünür.<br />
Şekil 3.21 Birleşen karakterlerin ayrıştırılması<br />
Yapılan gözlemler sonucunda “1” rakamının alabileceği en küçük aralık değerinin<br />
9’dan büyük olması sebebiyle karakter genişliği 9-29 aralığında seçilmiştir. Karakter<br />
olamayacak kadar küçük olan bölgeler silinir.<br />
(a) (b)<br />
(c) (d)<br />
Şekil 3.22 Plaka görüntüsünden plaka karakteri harici nesnelerin silinmesi, (a) Araç<br />
görüntüsünden elde edilen plaka bölgesi, (b) Karakterlerin plaka çerçevesinden<br />
ayrıştırılması, (c) İkili seviyedeki Plaka bölgesinin görüntüsü, (d) Plaka karakteri<br />
harici bölgelerin temizlenmesi<br />
TC plaka standartlarına göre karakter sayısı 6-8 arasında olması gerekir. Ayrıştırılan<br />
karakter sayısını kontrol edilerek bu değerler arasında ise karakter tanıma aşamasına<br />
gönderilir.<br />
60
Karakter ayrıştırma işlemi, her bir karakterin etiketlenmesi yöntemiyle de<br />
bulunabilir. Plaka bölgesi içinde birbirine komşuluğu olan bölgeler bir sayı değeri ile<br />
etiketlenirler. Böylece komşu olmayan bölgeler birbirinden ayrılmış olur. Belirli bir<br />
ebatın altında kalan bölgeler ise otomatik olarak silinir. Bu yöntem ile karakter<br />
ayrıştırmanın en büyük dezavantajı; birbiri ile birleşen iki karakteri, tek bir karakter<br />
olarak belirlenmesidir. Bu durumda birlikte çıkarılan bu karakterler, tanıma<br />
aşamasında tanımlanamamaktadır. Aynı zamanda karakterin çerçeveyle birleşmesi<br />
durumunda karakterin belirlenmesi zordur.<br />
Şekil 3.23 Etiketleme ile karakterlerin ayrıştırılması<br />
3.3. Karakterlerin Tanınması<br />
Plaka bölgesinden ayrıştırılan her bir karakterler, ikilik seviyeyede, izdüşüm işlemi<br />
yapılarak karakterin ana hattı (contour) belirlenir ve 25x20 boyutlarında yeniden<br />
boyutlanır. Daha sonra inceltme ve kalınlaştırma işlemi yapılarak tanıma aşaması<br />
için hazır hale getirilir.<br />
Bu çalışmada karakter tanıma için destek vektör makineleri kullanılmıştır. Destek<br />
Vektör Makineleri (DVM), V.N. Vapnik tarafından geliştirilen istatistiksel öğrenme<br />
teorisi üzerine kurulu olan modern hesaba dayalı bir öğrenme metodudur.<br />
DVM’lerde giriş uzayı yüksek boyutlu bir özellik uzayına düşürülür ve özellik<br />
uzayında sınıflandırıcının genelleme yeteneğini arttırmak için optimal bir<br />
hiperdüzlem seçilir. Bu hiperdüzlem aracılığıyla özelliklerin hangi sınıfa ait olduğu<br />
tespit edilir. DV sayısının çokluğu hesapsal kolaylığı ortadan kaldırır. Oysaki DVM<br />
yönteminin önemli bir özelliği hesapsal kolaylık sağlamasıdır. DV’ler dışındaki giriş<br />
örneklerinin Lagrange çarpanları 0’a eşittir. DV’lerin Lagrange çarpanları 0’a eşit<br />
61
olmadığı için ne kadar çok DV olursa işleme alınacak örnek sayısı da artacak ve<br />
işlemleri zorlaştıracaktır. DV’lerin sayısının çok olması iyi bir sınıflandırma<br />
yapılmadığını göstermektedir. Bu durum seçilen kernel fonksiyonuna ve C yaptırım<br />
parametresine bağlıdır.<br />
Karakter tanıma için destek vektör makinelerin çoklu sınıflandırma yöntemlerinden<br />
birine-karşı-biri metodu kullanılmıştır. Birine-karşı-biri metodunda önce iki sınıf<br />
alınır, bu iki sınıf birbirinden ayrılır, daha sonra diğer ikili gruplar sınıflandırılır.<br />
Son olarak da birbirinden ayrılan bütün sınıflar birleştirme yöntemi kullanılarak<br />
çoklu sınıflandırma işlemi gerçekleştirilmiş olur.<br />
Bu uygulamada kernel fonksiyonu olarak RBF kerneli kullanılmıştır. C yaptırım<br />
parametresi de sonsuz olarak ayarlanmıştır.<br />
Plaka hem harfler hem de rakamlardan oluştuğu için, bu karakter kümeleri arasında<br />
yüksek tanıma oranı elde etmek için özellikle B ve 8, O ve sıfır(0), G ve 6 ve bunun<br />
gibi durumlarda olduğu gibi. Plakanın özelliklerine göre karakter tanıma işlemi 2<br />
kısma ayrılabilir. Bu ön bilgiyle, harfler ve rakamlar bağımsız olarak tanınacak ve O<br />
ve 0 (sıfır), 8 ve B arasında olduğu gibi karakterler arasındaki karışıklık çözülecektir.<br />
62
4. ARAŞTIRMA BULGULARI VE TARTIŞMA<br />
Geliştirilen yöntemin performansı TC araç test görüntü verileri ile sınanmıştır.<br />
Görüntüler plakanın işlenebilirliği göz önünde tutularak yaklaşık 2-5m mesafeden<br />
alınmıştır. Çalışmada kullanılan görüntüler, günün farklı saatlerinde, farklı açılardan<br />
çekilmesine önem verilmiştir. Kontrollü geçişlerde kullanılacağı göz önüne alınarak<br />
duran ya da yavaş seyreden araçlardan görüntüler alınmıştır.<br />
Sistem tarafından test edilen değişik mekânlarda rasgele seçilen yaklaşık 120 adet<br />
aracın 240 adet görüntüsünün, plaka yerini saptama test sonuçları Çizelge 4.1<br />
verilmiştir.<br />
Çizelge 4.1 Plaka tanıma sisteminin test sonuçları<br />
Görüntü sayısı Yüzdelik oran<br />
Plaka yerini saptama 237/240 98.75<br />
Karakterlerin tanımlanması 215/237 % 91<br />
Sistemin plaka yerini bulmada başarısız olmasının nedeni, alınan görüntüde plaka<br />
bölgesinin büyük bir alanın çok karanlık olmasından veya plaka üzerindeki ışık<br />
şiddetinin çok az olmasından kaynaklanmaktadır. Bundan dolayı eşikleme<br />
algoritması plaka bilgisini yok etmektedir. Sitemin plaka yerini saptama başarısı %<br />
98.75 olarak belirlenmiştir.<br />
Şekil 4.1‘de plaka yer saptama biriminin başarılı olduğu farklı zamanlarda çekilen<br />
görüntüler gösterilmiştir.<br />
63
Şekil 4.1 Plaka yer saptama biriminin başarılı olduğu farklı zamanlarda çekilen<br />
görüntüler<br />
64
Şekil 4.2 Plaka yer saptama biriminin başarısız olduğu görüntü<br />
Şekil 4.2’de karakterlerin yazı renginin silikleşmesinden kaynaklanan plaka yer<br />
saptama biriminin başarısız olduğu görüntüye örnek gösterilmiştir.<br />
Başarılı bir şekilde çıkarılan, plaka bölgesinde, izdüşüm bilgisi kullanılarak karakter<br />
ayrıştırma işlemi yapılır. Çizelge 4.2’de görüldüğü gibi, plaka bölgesinin düzlemle<br />
paralel hale getirilerek karakter ayrıştırma işleminin başarısı artırılır.<br />
Çizelge 4.2 Plaka bölgesinin döndürülmesinin etkisi<br />
Karakter<br />
Ayrıştırma %<br />
Döndürülmüş görüntü %98<br />
Döndürülmemiş<br />
görüntü<br />
%75<br />
DVM’ ye girdi olarak sütun vektörü istediği için, 25x20 olan matrisler 500x1’lik<br />
vektörlere dönüştürülür. Daha küçük matrislerle çalışmak karakterlerin tanınmasını<br />
güçleştirirken, daha büyük boyutlarda olması ise işlem süresini artırmaktadır. Şekil<br />
olarak birbirine çok benzerlik gösteren karakterlerinin ayrıntılarının çok olması<br />
tanıma oranlarını artıracaktır.<br />
65
Korelasyon ile karakter tanıma yönteminde, bilinmeyen karakter şablondaki<br />
karakterler ile teker teker korelasyona sokulur ve sonuçları kıyaslanır. Kıyaslanan iki<br />
görüntünün doğrusal ilişkileri incelenir. En yüksek korelasyon sonucu ile bilinen<br />
karakter eşleştirilir. Bu yöntemde karakter kendisi ile korelasyona sokulduğunda<br />
gözlenen en yüksek değer olan “1”i verir. Çalışmada denenmiş olan korelasyon<br />
işlemi sonuçları Çizelge 4.3’de verilmiştir. İşlem sayısının çok fazla olduğu bu<br />
yöntemde veri bankasındaki şablon sayısı x, plakadaki alfa nümerik sayısı y ise; x y<br />
× kadar işlem yapılması gerekir. Yüksek doğruluk elde etmek için, karşılaştırılan iki<br />
karakterin birbirine büyük oranda benzemesi gerekmektedir. Kaldı ki, günün farklı<br />
saatlerinde, farklı açılardan çekilen birbirinin aynısı iki plakada bile bu oranlar<br />
birbirine yakınsamayacaktır. Bu yöntemle “8” ile “B”nin ve “0”, “O” ve “D”<br />
karakterlerinin tanınması çok zordur.<br />
Çizelge 4.3 Karakter tanıma başarısı<br />
Karekter tanıma %<br />
Destek Vektör Makineleri %91<br />
Korelasyon %84<br />
Plaka yeri doğru olarak tespit edilen 237 görüntünün plakalarının tanınması için<br />
plaka karakterlerini tanıma modülünde test edilmiştir. Test sonuçları çizelge 4.3’de<br />
gösterilmiştir. Kimi harf ve rakam ikililerinin, D-O, A-R, H-N gibi, birbirlerine olan<br />
benzerlikleri sınıflandırma hatalarına yol açmaktadır. Plaka karakterlerin hepsinin<br />
doğru okunması dikkate alınarak karakter tanıma başarısı %91 olarak belirlenmiştir.<br />
66
5. SONUÇLAR<br />
Gerçek zamanlı taşıt görüntülerinden taşıt plakasını tanıyan bir sistem geliştirilmiştir.<br />
Geliştirilen yöntemin performansı Türkiye tarzı plaka test görüntü verileri ile<br />
sınanmıştır. Bu işlemler MATLAB® yazılım paketi görüntü işleme ve DVM araç<br />
kutuları kullanılarak gerçekleştirilmiştir.<br />
Test görüntü verileri, günün farklı saatlerinde, rastgele mekânlarda, belirli bir<br />
mesafeden, 640x480 çözünürlükte alınarak elde edilmiştir. Bu görüntüler içerisinde<br />
sadece araba değil aynı zamanda kamyon, motosiklet, tır görüntüleri de vardır. Bu<br />
test verileri üzerinde yapılan testlerde, plaka yerini saptamada %98.75, plaka<br />
karakterlerinin tanınmasında %91 başarı sağlanmıştır. Elde edilen sonuçlara<br />
bakıldığında önerilen sistemin araç plaka bölgelerini saptamada yeterince başarılı<br />
olduğu görülmüştür. Birçok karmaşık yöntemlere gerek duyulmadan sadece<br />
morfolojik işlemler yardımıyla plaka yer saptama işlemi basitçe bu çalışmayla<br />
gerçekleştirilmiştir. Önerilen yöntem ile plaka olmayan bölgeler elenerek, daha<br />
detaylı işlem gerektiren bölge sayısı en aza indirilir ve doldurma işlemiyle çift satırlı<br />
plakaları tespitinde avantaj sağlanır.<br />
DVM’ler istatistiksel öğrenme teorisinde iyi şekilde kurulmuş bir teoriye sahiptir ve<br />
sınıflandırma ile regresyon problemlerine yaklaşım için uygundur. Özellikle iki<br />
sınıflı sınıflandırma probleminde DVM iki sınıf arasındaki sınırı büyükleyen<br />
optimal ayırt etme yüzeyini belirlemekte, yani eğitim kümesi ile ayırt etme yüzeyine<br />
en yakın noktaların arasındaki mesafeyi en büyüklemektedir. Çok katmanlı<br />
perseptron ve radyal tabanlı ağlar, uygun çekirdek fonksiyonları ile elde edilen<br />
DVM ağların özel durumları olarak gösterilebilir. Sistemde çoklu-sınıflı<br />
metotlardan en kullanışlısı olan birine-karşı-biri metodu ve RBF (Radial Basis<br />
Function) kerneli kullanılmıştır.<br />
67
Gerçek zamanlı taşıt görüntülerinin yanlardan ya da farklı açılardan alınması durumu<br />
söz konusudur. Bu durumun; hem plakanın sınır bölgesini bulma aşamasında hem de<br />
karakter ayrıştırma işleminde performansı azalttığı gözlenmiştir. Bu sebeple hough<br />
dönüşümü kullanılarak, çıkarılan plaka bölgesinin düzlem ile paralel olması<br />
sağlanmıştır.<br />
68
6. KAYNAKLAR<br />
A.U. Özkaya, M.E. Kaya, F. Gürgen, Destek Vektör Makineleri Kullanılarak Aritmi<br />
Sınıflandırması, Intelligent Arrhythmia Classification Based On Support<br />
Vector Machines.<br />
Burges, J.C.,1998 “A Tutorial on Support Vector Machines for Pattern Recognition”,<br />
Data Mining and Knowledge Discovery 2,21-167,<br />
Çamaşırcıoğlu E., 2007. Araç Plakası Algılama Ve Tanıma. Ankara <strong>Üniversitesi</strong><br />
Yüksek Lisans Tezi.<br />
Demiröz B. E., 2005. Bakış Açısından Bağımsız Gürbüz Plaka tanıma sistemi.<br />
Bitirme Ödevi, İstanbul Teknik <strong>Üniversitesi</strong>.<br />
Duman Ş., Öktem R., Çetin A.E., 2005. Plaka Tanıma Amaçlı Alternatif Öznitelik<br />
Çıkarma Yaklaşımları. IEEE.<br />
DVM Yazılımı, Statistical Pattern Recognition Toolbox for Matlab,<br />
http://cmp.felk.cvut.cz/cmp/software/stprtool<br />
E. Dougherty, Editor, Marcel-Dekker, 1994, Morphological Segmentation for<br />
Textures and Particles, Published as Chapter 2 of Digital Image Processing<br />
Methods, New York, Pages 43-102.<br />
Hernes D. l., 2005. Feature Extraction And Classification Of Precancerous Cervix<br />
Lesions. Master of science.<br />
Hsieh C., Juan Y., Kuo-Ming Hung , Multiple License Plate Detection for Complex<br />
Background.<br />
Hua, S., Sun, Z., “Support vector machine approach for protein subcellular<br />
localization prediction,” Bioinformatics.,cilt 17, sayı 8, sayfa 721-728, 2001.<br />
Kahraman F., Gökmen M., 2003. Gabor Süzgeçler Kullanılarak Taşıt Plakalarının<br />
Yerinin Saptanması, Sinyal İşleme ve Uygulamaları Kurultayı, sayfa 317-<br />
322, Koç <strong>Üniversitesi</strong>.<br />
Kamat, V. and Ganesan, S., 1995. An efficient implementation of the Hough<br />
transform for detecting vehicle license plates using DSP'S, Real-Time<br />
Technology and Applications Symposium.<br />
69
Kim S., Daechul Kim, Younbok Ryu, and Gyeonghwan K., A Robust License-Plate<br />
Extraction Method under Complex Image Conditions.<br />
Kwaśnicka H. and Bartosz Wawrzyniak, 2002. License plate localization and<br />
recognition in camera pictures. AI-METH– Artificial Intelligence Methods<br />
Gliwice, Poland.<br />
Martín F., Maite García, José Luis Alba, New Methods For Automatıc Readıng Of<br />
Vlp's (Vehıcle Lıcense Plates).<br />
Wei-gang Z., Hou Guo-jiang, Jia Xing, 2002. A Study of Location Vehicle License<br />
Plate Based on Color Feature and Mathematical Morphology. ICSP’02<br />
Proceedings.<br />
Ozbay S., Ercelebi E., 2005. Automatic Vehicle Identification by Plate Recognition,<br />
Transactions on Engineering. Computing and Technology V9.<br />
Rafael C. GGonzalez, Richard E. Woods, Steven L. Eddins, 2004, “Digital Image<br />
Processing Using MATLAB”.<br />
Sonka, Milan, Hlavac, Vaclav, Boyle, Roger, Image Processing, Analysis, and<br />
Machine Vision, PWS Publishing, Pacific Grove, 1999, p574-575.<br />
U. Çelik, 2003. Motorlu Araçlar İçin Plaka Tanıma Sistemi. Yüksek Lisans Tezi,<br />
Mustafa Kemal <strong>Üniversitesi</strong>, Antakya.<br />
Vapnik , V., 1998. “Statistical Learning Theory”, Wiley.<br />
V. Koval, V. Turchenko, V. Kochan, A. Sachenko, G. Markowsky, 2003. Smart<br />
License Plate Recognition System Based on Image Processing Using Neural<br />
Network. IEEE International Workshop on Intelligent Data Acquisition and<br />
Advanced Computing Systems: Technology and Applications, Lviv, Ukraine.<br />
Yang F., Zheng Ma, Vehicle License Plate location Based on Histogramming and<br />
Mathematical Morphology.<br />
Yıldırım S., 2006. Arıza Teşhisinde Destek Vektör Makinelerinin Kullanımı. Fırat<br />
<strong>Üniversitesi</strong> Yüksek Lisans Tezi<br />
Zheng D., Yannan Zhao, Jiaxin Wang, 2005. An efficient method of license plate<br />
location. Pattern Recognition Letters 26 (2005) 2431–2438<br />
70
Adı Soyadı : Halime BOZTOPRAK<br />
Doğum Yeri ve Yılı: Seydişehir - 1982<br />
Medeni Hali : Bekar<br />
Yabancı Dili : İngilizce<br />
Eğitim Durumu (Kurum ve Yıl)<br />
ÖZGEÇMİŞ<br />
Lise : Yabancı Dil Ağırlıklı Enis Şanlıoğlu Lisesi, 2000<br />
Lisans : <strong>Süleyman</strong> <strong>Demirel</strong> <strong>Üniversitesi</strong>, 2004<br />
Yüksek Lisans : <strong>Süleyman</strong> <strong>Demirel</strong> <strong>Üniversitesi</strong>, 2007<br />
Yayınları (SCI ve diğer makaleler)<br />
1- H. Boztoprak, M. F. Çağlar, M. Merdan,"Alternatif Morfolojik Bir Yöntemle<br />
Plaka Yerini Saptama", XII. Elektrik, Elektronik, Bilgisayar, Biyomedikal<br />
Mühendisliği Ulusal Kongresi, Kasım 2007, Eskişehir.<br />
71