13.01.2013 Views

D - Süleyman Demirel Üniversitesi

D - Süleyman Demirel Üniversitesi

D - Süleyman Demirel Üniversitesi

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

T.C.<br />

SÜLEYMAN DEMİREL ÜNİVERSİTESİ<br />

FEN BİLİMLERİ ENSTİTÜSÜ<br />

GERÇEK ZAMANLI TAŞIT PLAKA TANIMA SİSTEMİ<br />

HALİME BOZTOPRAK<br />

Danışman: Prof.Dr. Mustafa MERDAN<br />

YÜKSEK LİSANS TEZİ<br />

ELEKTRONİK ve HABERLEŞME<br />

MÜHENDİSLİĞİ ANABİLİMDALI<br />

ISPARTA – 2007


Fen Bilimleri Enstitüsü Müdürlüğüne<br />

Bu çalışma jürimiz tarafından ELEKTRONİK HABERLEŞME ANABİLİM<br />

DALI'nda oybirliği/oyçokluğu ile YÜKSEK LİSANS TEZİ olarak kabul edilmiştir.<br />

Başkan : Prof.Dr.Mustafa MERDAN (İmza)<br />

SDU Müh.Mim.Fak.Elekt.ve Hab.Müh.Bölümü<br />

Üye : Yrd.Doç.Dr.Bayram CETİŞLİ (İmza)<br />

SDU Müh.Mim.Fak.Bilgisayar Müh.Bölümü<br />

Üye : Yrd.Doç.Dr.Mesud KAHRİMAN (İmza)<br />

SDU Müh.Mim.Fak.Elekt.ve Hab.Müh.Bölümü<br />

ONAY<br />

Bu tez 22/11/2007 tarihinde yapılan tez savunma sınavı sonucunda, yukarıdaki jüri<br />

üyeleri tarafından kabul edilmiştir.<br />

1<br />

Prof. Dr. Fatma GÖKTEPE<br />

Enstitü Müdürü


İÇİNDEKİLER<br />

2<br />

Sayfa<br />

İÇİNDEKİLER......................................................................................................... i<br />

ÖZET ..................................................................................................................... iii<br />

ABSTRACT............................................................................................................vi<br />

TEŞEKKÜR .............................................................................................................v<br />

ŞEKİLLER DİZİNİ .................................................................................................vi<br />

ÇİZELGELER DİZİNİ ......................................................................................... viii<br />

SİMGELER VE KISALTMALAR DİZİNİ..............................................................ix<br />

1. GİRİŞ ............................................................................................................11<br />

2. KURAMSAL TEMELLER............................................................................15<br />

2.1.1 Gerçek renk-gri skala dönüşümü .................................................................15<br />

2.1.2 Eşikleme .....................................................................................................15<br />

2.1.2.1 Otsu Eşik Belirleme Yöntemi ...................................................................16<br />

2.2. Geometrik Dönüşümler ..................................................................................18<br />

2.3. Bölgelerin Etiketlenmesi ................................................................................19<br />

2.4. Morfolojik İşlemler ........................................................................................20<br />

2.5. Top-Hat Dönüşümü........................................................................................25<br />

2.6. Hough Dönüşümü ..........................................................................................27<br />

2.7. Karakter Tanıma ............................................................................................30<br />

2.7.1 Karakter Tanıma Ön İşlemler ......................................................................30<br />

2.7.1.1 Eşikleme ..................................................................................................31<br />

2.7.1.2 İnceltme ...................................................................................................31<br />

2.7.1.3 Onarım .....................................................................................................32<br />

2.7.1.4 Normalleştirme.........................................................................................32<br />

2.7.2 Korelasyon ile Karakter Tanıma..................................................................32<br />

2.7.3 Destek Vektör Makineleri Ve Öğrenme Metodolojisi ..................................33


2.7.3.1 Lineer Öğrenme Makineleri......................................................................33<br />

2.7.3.1.1 Lineer Sınıflandırma..............................................................................33<br />

2.7.3.1.2 Kernel Tabanlı Özellik Uzayı ................................................................35<br />

2.7.3.1.3 Özellik Uzayları ve Kerneller ................................................................35<br />

2.7.3.1.4 Özellik Uzayında Öğrenme....................................................................36<br />

2.7.3.1.5 Vapnik ve Chervonenkis (VC) Teorisi ve VC Boyutu............................37<br />

2.7.3.1.6 Langrangian Teorisi...............................................................................38<br />

2.7.3.2 Destek Vektör Makineleri (Support Vector Machines).............................39<br />

2.7.3.2.1 En Büyük Sınırlı Sınıflandırma ve Lineer Destek Vektör Makineleri.....40<br />

2.7.3.2.2 Lineer Ayırt Edilebilir Sınıflar...............................................................41<br />

2.7.3.2.3 Lineer Olarak Ayırt Edilemeyen Sınıflar ...............................................43<br />

2.7.3.2.4 Nonlineer Destek Vektör Makineleri Sınıflandırıcıları...........................44<br />

2.7.3.2.5 Çok Sınıflı Sınıflandırma.......................................................................46<br />

2.7.3.2.6 Bire-karşı-biri Metodu...........................................................................47<br />

2.7.3.2.7 Bire-karşı-diğerleri Metodu ...................................................................47<br />

3. MATERYAL VE YÖNTEM..........................................................................48<br />

3.1. Plaka Bölgesinin Bulunması...........................................................................48<br />

3.1.1 Bölgelerin Etiketlenmesi .............................................................................51<br />

3.1.2 Aday Plaka Bölgelerin Sağlaması Gereken Koşullar....................................52<br />

3.1.3 Plaka Bölgesinin Yatayla Paralel Hale Getirilmesi ......................................54<br />

3.1.4 Plaka Çerçevesinin Çıkarılması ...................................................................56<br />

3.2. Karakterlerin Ayrıştırılması............................................................................58<br />

3.2.1 Plakanın Normalize Edilmesi ......................................................................58<br />

3.3. Karakterlerin Tanınması.................................................................................61<br />

4. ARAŞTIRMA BULGULARI VE TARTIŞMA..............................................63<br />

5. SONUÇLAR..................................................................................................67<br />

6. KAYNAKLAR ..............................................................................................69<br />

ÖZGEÇMİŞ............................................................................................................70<br />

3


ÖZET<br />

Yüksek Lisans Tezi<br />

GERÇEK ZAMANLI TAŞIT PLAKA TANIMA SİSTEMİ<br />

Halime BOZTOPRAK<br />

<strong>Süleyman</strong> <strong>Demirel</strong> <strong>Üniversitesi</strong> Fen Bilimleri Enstitüsü<br />

Elektronik-Haberleşme Anabilim Dalı<br />

Plaka tanıma sistemleri araç tanıma otomasyonunda kullanılan tekniklerden biridir.<br />

Trafik denetleme, giriş otomasyonu ve denetimli saha giriş kontrolü uygulamalarında<br />

verimli olarak kullanılırlar.<br />

Bu çalışmada, Türk araç plakaları için plaka tanıma sistemi geliştirilmiştir. Tanıma<br />

işlemi üç aşamada gerçekleştirilmiştir; plaka bölgesinin bulunması, karakterlerin<br />

ayrıştırılması ve karakterlerin tanınması. Plaka bölgesinin bulunmasında, plaka<br />

olamayacak bölgeleri bastıran, plaka bölgesi olabilecek bölgeleri ön plana çıkartan<br />

top-hat dönüşümü kullanılmıştır. Bu dönüşümle plaka bölgesini kolaylıkla belirgin<br />

haline getirilerek doldurma işlemi ile de plakayı içeren bölge tespit edilir. Karakter<br />

ayrıştırma işlemi için yatay ve dikey izdüşümlerinden faydalanılmıştır ve Ayrıştırılan<br />

karakterler, destek vektör makineleri kullanılarak tanımlanmıştır. Ayrıca, kamera<br />

görüş açısından dolayı plaka bölgesi dikdörtgeninde meydana gelen bozulmalarda<br />

düzeltilmeye çalışılmıştır.<br />

Çalışmada plaka bölgesinin bulunması için %98, karakter ayrıştırma ve tanıma için<br />

%91 doğruluk oranlarına ulaşılmıştır.<br />

Anahtar Kelimeler: Plaka tanıma, morfolojik işlemler, top-hat dönüşümü, karakter<br />

tanıma, destek vektör makineleri.<br />

2007, 70 sayfa<br />

4


ABSTRACT<br />

M.Sc. Thesis<br />

REAL TIME VEHICLE LICENSE PLATE RECOGNITION<br />

Halime BOZTOPRAK<br />

<strong>Süleyman</strong> <strong>Demirel</strong> University Graduate School of Applied and Natural Sciences<br />

Electronic-Telecommunication Department<br />

Vehicle license plate recognition systems are used for automated recognition of<br />

vehicles. They can be efficiently employed for traffic monitoring of roads, automated<br />

till collection.<br />

In this study, a license plate recognition system for the vehicles which have license<br />

plates, conform to Turkish Plates has been developed. The recognition process can<br />

be done in three major steps; Extraction of plate region, segmentation of plate<br />

characters and recognition of plate characters. For extraction of plate region have<br />

been used Top-hat transform and fiilling process. Vertical and horizontal projections<br />

are used for character segmentation. Character recognition has been achieved by<br />

support vector machines. Any deformation on the plate region of rectangular shape<br />

caused by an improper camera viewing parameters has been recovered.<br />

An accuracy of 98% is achieved for license plate localization and %91 for character<br />

segmentation and recognition.<br />

Key Words: License plate recognition, morphology processing, top-hat transform,<br />

character recognition, support vector machines.<br />

2007, 70 pages<br />

5


TEŞEKKÜR<br />

Bu tez için beni yönlendiren, bilgi ve tecrübesi ile bana yardımcı olan danışman<br />

hocam Prof. Dr. Mustafa MERDAN’a teşekkür ederim.<br />

Ayrıca tezimin her aşamasında beni yalnız bırakmayan ve destekleyen aileme ve<br />

arkadaşlarıma sonsuz sevgi ve saygılarımı sunarım.<br />

6<br />

Halime BOZTOPRAK<br />

ISPARTA, 2007


ŞEKİLLER DİZİNİ<br />

Şekil 1.1 Plaka örnekleri .........................................................................................13<br />

Şekil 2.1 Genişletme işlemi.....................................................................................21<br />

Şekil 2.2 Aşındırma işlemi......................................................................................21<br />

Şekil 2.3 Açma işlemi.............................................................................................22<br />

Şekil 2.4 Kapatma işlemi ........................................................................................22<br />

Şekil 2.5 Yapısal eleman örnekleri..........................................................................23<br />

Şekil 2.6 Gri seviyedeki genişleme işlemi ...............................................................24<br />

Şekil 2.7 Gri seviyedeki aşındırma işlemi ...............................................................24<br />

Şekil 2.8 Yeniden oluşturulma işlemi (Vincent, 1993).............................................25<br />

Şekil 2.9 TopHat dönüşümün aydınlık ve koyu nesneler için parlaklık gösterimi ....26<br />

Şekil 2.10 Top-Hat dönüşümünün elde edilmesi: a,e) yapı elemanı; b,f) orijinal<br />

resim; c,g) açma (diğeri kapama); d,h) çıkarma sonucu...........................................27<br />

Şekil 2.11 Hough Dönüşüm metodu ile doğruların bulunması.................................28<br />

Şekil 2.12 Bir doğrunun ifadesi...............................................................................29<br />

Şekil 2.13 (a) Sinüs eğrisi, (b) Kesişen noktalar .....................................................29<br />

Şekil 2.14 Kesişen doğruların grafiksel gösterilmesi ...............................................30<br />

Şekil 2.15 Karakter ön işlemleri..............................................................................31<br />

Şekil 2.16 İnceltme işlemi için yapısal elemanlar ....................................................31<br />

Şekil 2.17 İnceltme işlemi.......................................................................................31<br />

Şekil 2.18 İki boyutlu eğitim seti için bir (w,b) ayırıcı hiperdüzlemi .......................34<br />

Şekil 2.19 Giriş uzayından özellik uzayına dönüşüm...............................................36<br />

Şekil 2.20 Sınıflandırma işini basitleştiren bir özellik haritası .................................37<br />

Şekil 2.21 Sınır değerleri.........................................................................................43<br />

Şekil 3.1 Plaka bölgesinin bulunması......................................................................49<br />

Şekil 3.2 (a) Giriş görüntü, (b) Top-hat dönüşümü ..................................................49<br />

Şekil 3.3 Resmi plakaya uygulanan koyu nesneler için Top Hat dönüşümü.............50<br />

Şekil 3.4 (a) Orijinal görüntü, (b) Top hat dönüşümü ve doldurma işleminin<br />

uygulanmış hal, (c) ikilik seviyedeki görüntü..........................................................51<br />

Şekil 3.5 İkilik seviyedeki görüntü..........................................................................51<br />

7


Şekil 3.6 Etiketlenen görüntü ..................................................................................52<br />

Şekil 3.7 (a) Aday plaka bölgesi, (b) Etiketleme......................................................53<br />

Şekil 3.8 Plakası bulunacak görüntü........................................................................54<br />

Şekil 3.9 Bulunan plaka bölgesi ..............................................................................54<br />

Şekil 3.10 Hough dönüşümü ..................................................................................55<br />

Şekil 3.11 Plaka bölgesinin eğriliğin tespiti............................................................55<br />

Şekil 3.12 Shear dönüşümü.....................................................................................55<br />

Şekil 3.13 Shear dönüşümü uygulanmış plaka bölgesi.............................................56<br />

Şekil 3.14 Plaka çerçevesinin çıkarılması için dikey (a) ve yatay (b) izdüşüm .........57<br />

Şekil 3.15 Plaka karakterlerini içeren görüntü .......................................................57<br />

Şekil 3.16 [40 180] ebadında normalize edilmiş görüntü .........................................58<br />

Şekil 3.17 [20 100] ebadında normalize edilmiş görüntü .........................................58<br />

Şekil 3.18 [15 80] ebadında normalize edilmiş görüntü...........................................58<br />

Şekil 3.19 Karakterlerinin izdüşümü .......................................................................59<br />

Şekil 3.20 Karakter olmayan bölgelerin silinmesi....................................................59<br />

Şekil 3.21 Birleşen karakterlerin ayrıştırılması........................................................60<br />

Şekil 3.22 Plaka görüntüsünden plaka karakteri harici nesnelerin silinmesi.............60<br />

Şekil 3.23 Etiketleme ile karakterlerin ayrıştırılması ...............................................61<br />

Şekil 4.1 Plaka yer saptama biriminin başarılı olduğu farklı zamanlarda çekilen<br />

görüntüler ...............................................................................................................64<br />

Şekil 4.2 Plaka yer saptama biriminin başarısız olduğu görüntü ..............................65<br />

8


ÇİZELGELER DİZİNİ<br />

Çizelge 2.1 Geometrik dönüşümler .........................................................................18<br />

Çizelge 4.1 Plaka tanıma sisteminin test sonuçları...................................................63<br />

Çizelge 4.2 Plaka bölgesinin döndürülmesinin etkisi...............................................65<br />

Çizelge 4.3 Karakter tanıma başarısı .......................................................................66<br />

9


ai<br />

Langrange çarpanları<br />

b Bias terimi<br />

SİMGELER VE KISALTMALAR DİZİNİ<br />

D Herhangi bir nokta ile hiperdüzlem arasındaki mesafe<br />

DVM Destek vektör makineleri<br />

DV Destek vektörleri<br />

f(x) Hiperdüzlem denklemi<br />

iF<br />

Gösterge fonksiyonu<br />

k Sınıf sayısı<br />

L(w,b) Langrangian fonksiyonu<br />

n Eğitim örnekleri sayısı<br />

PST Plaka tanıma sistemi<br />

PYS Plaka yer saptama<br />

VC Vapnik chervonenkis boyutu<br />

x Serbestlik değişkenleri<br />

xi<br />

yi<br />

Giriş verileri<br />

Giriş verilerine uyan çıkış etiketleri<br />

w Ağırlık terimi<br />

10


1. GİRİŞ<br />

Görüntü işleme uygulamalarından biri olan plaka tanıma, günümüzde trafikteki araç<br />

sayısı göz önüne alındığında oldukça popüler uygulama alanlarındandır. Araç<br />

sayısının artması ve trafikte oluşan sorunlar, otomatik araç tanıma ve trafik akış<br />

kontrolü sistemlerinde duyulan ihtiyacı arttırmıştır. Bu amaca yönelik çalışmalar<br />

temel olarak araçları özel bir noktadan geçerken tanımlamak, aracın konumunu<br />

belirlemek, davranışlarını gözlemlemek ve bu verileri kullanarak trafik denetimini<br />

sağlamaya yöneliktir. Otomatik taşıt plakası tanıma sistemlerini (PTS-Plaka Tanıma<br />

Sistemi) kullanışlı ve pratik yapan; aracı belirlemek için hali hazırda aracın üzerinde<br />

olan plakayı kullanmasıdır. Plaka araca ait her türlü bilgiyi içermektedir. Ek hiç bir<br />

bilgiye ya da araca takılacak ek donanıma gerek kalmadan, aracın belirlenmesi bu<br />

PTS sistemleri ile mümkündür.<br />

Giriş-çıkışların sınırlanması ve kontrol altına alınması gereken tesisler, ücretli<br />

otoyollar, otopark uygulamaları, akan trafikte araçların takibi ve otoyol otomatik<br />

geçiş plaka tanıma sistemlerinin başlıca uygulama alanlarıdır. Giriş-çıkışların kontrol<br />

altına alınması gereken yerlerde, işlemin insan tarafından yapılması, işlem süresini<br />

artırmakta ve güvenilirliğini azaltmaktadır.<br />

Araç plaka tanıma günümüzde otomatik park sistemleri, trafik denetimi, araç takibi,<br />

köprü ve otoyol otomatik geçiş sistemleri gibi birçok alanda kullanılmaktadır. Bu<br />

nedenle plakaların tanınması ve plaka yerinin saptanması ile ilgili literatürde pek çok<br />

çalışma bulunmaktadır. Örneğin, kenar ayrıştırma (Boroujeni, 2000; Hongliang ve<br />

Changping, 2004), Hough dönüşümü (Kamat ve Ganesan, 1995; Shapiro vd., 2003),<br />

simetri özelliği (Kim ve Chien, 2001), morfolojik işlemler (Hsieh vd., 2001;<br />

Hongliang ve Changping, 2004), renk özelliği, histogram analizi v.s gibi sayısız<br />

teknikler önerilmiştir. Yaygın olarak kullanılan plaka yer saptama yöntemlerini ayrıt<br />

11


temelli ya da bölge temelli yaklaşımlara dayanmaktadır. Plakanın dikdörtgen olduğu<br />

varsayımına dayalı olarak yatay ve düşey doğrultudaki ayrıtlara Hough dönüşümü<br />

uygulanarak plakayı çevreleyen sınırları saptayan yöntemler önerilmiştir (Kamat ve<br />

Ganesan, 1995). Bu yöntem yüksek işlem yükü ve bellek ihtiyacı nedenleriyle gerçek<br />

zamanlı sistemlerde tercih edilmemektedir. Ayrıca, yöntem, karmaşık artalana sahip<br />

görüntülerde yüksek negatif hata oranı vermektedir. Ayrıca çizgi histogramlarını<br />

analiz ederek plaka örüntüsüne özgü imzayı arayan (Barroso vd., 1997) veya plaka<br />

renk bilgisini kullanan (Kim vd.) plaka yer saptama yöntemleri mevcuttur. Ancak bu<br />

yöntemler gürültü ve perspektif bozulmalarına karşı oldukça duyarlıdır. Kenara bağlı<br />

yaklaşım normal olarak basit ve hızlıdır. Ancak istenmeyen kenarlara çok hassastır.<br />

Plaka yerinin tespit edildiği ve bunun için arka plan renginin kullanıldığı<br />

uygulamalarda, başarı oranı düşmekte ve en fazla %70’lerde kalmaktadır. Renkleri<br />

kullanılarak plaka bölgesi bulan yöntemlerde, yalnızca plakanın fon rengi<br />

aranmasının performansı düşürdüğü gözlenmiştir. Plakanın fon rengi ile aracın aynı<br />

renk olması durumunda ise plaka bölgesi bulunamamaktadır (Çamaşırcıoğlu, 2007).<br />

Literatürdeki birçok yöntem, plaka görüntülerinin hemen hemen tam karşıdan<br />

çekildiği varsayımı veya kısıtı altında çalışmaktadır. Genel olarak ayrıt saptama ve<br />

eşikleme tabanlı plaka yer saptama yöntemleri, plakanın belirli bir açı ile x-y<br />

düzleminde dönmesinden ve kameranın konumundan dolayı oluşan perspektif<br />

bozulmalardan kaynaklanan düşük başarıma sahiptir. Literatürde, x-y düzlemindeki<br />

dönme açısı, histogram analizi ve karakterlerin altından geçtiği varsayılan baz<br />

çizgisinin bularak saptamaya çalışan yöntemler bulunmaktadır. Bu yöntemler<br />

belirledikleri bu açıyı kullanarak giriş görüntüsünü dönmeden bağımsız hale<br />

getirirler.<br />

Plaka karakterlerinin ayrıştırılması için çeşitli yöntemler önerilmiştir: İzdüşüm<br />

histogramları (Yong vd., 2000) ve dikey kenarlar, morfoloji (Hsieh vd., 2000;<br />

12


Hongliang vd., 2004), bağlantılı bileşen analizi kullanan yöntemleri sayabiliriz. Bu<br />

yöntemlerin kendine göre kazanımları ve yitimleri bulunmaktadır. Ayrıca bu<br />

yöntemler belirli kısıtlar altında çalışmaktadır. Örneğin izdüşüm histogramına dayalı<br />

yöntemler plaka doğrultusunun, morfoloji temelli yöntemler ise plaka karakterlerinin<br />

boyutlarının bilindiğini varsayar (Kahraman vd., 2003).<br />

Araç plakalarının standartları ülkeden ülkeye ve hatta aynı ülke içerisinde dahi<br />

geometrik şekilleri itibariyle farklılık gösterebilmektedir. Plakalarının ortak<br />

özellikleri, sabit arka planları ile karakterler arasında yüksek kontrast olmasıdır.<br />

Değişik format ve renkte plakaların olması plaka yer saptama ve plaka tanıma<br />

problemini zorlaştıran etkenlerden biridir.<br />

Şekil 1.1 Plaka örnekleri<br />

Türkiye trafik denetleme kurumlarına kayıtlı yasal plakalar; sivil, resmi, askeri,<br />

diplomatik vs. gibi değişik renk ve biçimlerde olabilmektedir. Bu çalışmada,<br />

plakaların açık renkteki arkalan üzerindeki koyu karakterler veya koyu arkalan<br />

üzerindeki açık renkteki karakter içeren plaka tiplerinin tanınması amaçlanmıştır<br />

(Şekil 1.1).<br />

Plakaların resmi bir standardı olmasına rağmen, trafikte araçların bir kısmında<br />

standartlara uygun olmayan plakalar bulunmaktadır. Bununla birlikte, plakalar<br />

üzerinde çeşitli yabancı maddelerin; damgalar, çıkartmalar, fosforlar, pullar, vidalar,<br />

çamur v.b gibi bulunması ve kameradan elde edilecek görüntülerin kalitesinin<br />

13


aydınlatmaya bağlı olarak değişkenlik göstermesi ve aracın hızı, taşıt tanıma<br />

sisteminin yapılmasını güçleştiren faktörlerdir. Yukarıda belirtilen problemleri<br />

aşmak için, bazı görüntü işleme teknikleri kullanılmıştır.<br />

Bu tez çalışmasında, kuramsal temeller bölümde sistemde kullanılan gerekli bazı<br />

algoritmalardan bahsedilmiş, materyal ve yöntem bölümünde plaka tanıma sistemin<br />

çalışması açıklanmıştır. Daha sonra araştırma bulguları ve tartışma kısmında sistemin<br />

başarısı tartışılmıştır.<br />

14


2. KURAMSAL TEMELLER<br />

Bu bölümde yararlanılan görüntü işleme algoritmaları ve kullanılan yöntemler<br />

hakkında bilgi verilmiştir.<br />

2.1.1 Gerçek renk-gri skala dönüşümü<br />

İnsan görme sistemi, RGB (kırmızı, yeşil, mavi - red, green, blue) renk bölgesinde<br />

algılama yapar. Kırmızı, yeşil ve mavi ana renk bileşenlerinin her biri ayrı ayrı üç<br />

farklı matriste tutulur. Bahsi geçen üç matrisin bir arada, üst üste görüntülenmesi ile<br />

gerçek renk bileşenleri oluşur.<br />

Gerçek renk-gri skala dönüşümü, (2.1) denklemiyle bulunur.<br />

Y = 0.299R + 0.587G + 0.114B<br />

(2.1)<br />

Gerçek renk bileşenlerine sahip bir resmin işlenmesi, işlem sayısını artırır. Bu<br />

sebeple, resmin gri seviyeye ve hatta işlemin amacına göre siyah beyaz ikili forma<br />

dönüştürülmesi işlem sayısının asgaride tutulmasını sağlayacaktır.<br />

2.1.2 Eşikleme<br />

Gri seviye bir resim, her bir piksel için 0 ile 255 arasında bir parlaklık değeri alır. Ve<br />

gri tonda görüntü işte bu farklı parlaklık değerlerine göre oluşur. 0 değeri siyah 255<br />

ise beyazdır. Eşikleme işlemi, görüntü işlemenin önemli işlemlerinden biridir.<br />

Eşikleme işlemi, değişik gri ton seviyelerine sahip bir resmi ikilik seviyeye yani; 0<br />

siyah, 1 beyaz rengi göstermek üzere resmi 0 ve 1’lerden oluşan bir matris haline<br />

getirir. Eşikleme yaparken bir eşik değeri belirlenir ve bu değerin üstündeki değerler<br />

için çıkış imgesindeki ilgili piksele 1, altındaki değerler içinde 0 değeri atanır.<br />

Eşiklemenin genel ifadesi denklem (2.2)’de verilmiştir.<br />

G( i, j) = 1 f ( i, j) ≥ T için<br />

G( i, j) = 0 f ( i, j) < T için<br />

15<br />

(2.2)


Burada:<br />

T = Eşik<br />

G( i, j ) = 1 Nesnenin görüntü elemanları<br />

G( i, j ) = 0 Arka planın görüntü elemanlarıdır.<br />

Eğer görüntüdeki nesneler temassız ve gri seviyeleri açıkça arka planın gri<br />

seviyesinden farklı ise eşikleme uygun bir ayrıştırma metodudur. Doğru eşik seçimi<br />

başarılı bir görüntünün ayrıştırılabilmesi için gereklidir. Bu seçim etkileşimli veya<br />

çeşitli eşik tanımlama algoritmalarıyla yapılır.<br />

2.1.2.1 Otsu Eşik Belirleme Yöntemi<br />

Resmin etkili ve hızlı bir şekilde işlenebilmesi için en temel model olan siyah-beyaz<br />

modele dönüştürülmesi gerekir. Her gri resmin parlaklık değeri, çekildiği atmosfer<br />

koşullarına ve çevresel koşullara göre farklılık göstereceğinden, bu eşik seviyesinin<br />

değişken olarak belirlenebiliyor olması önem kazanır. Otsu’nun bölgesel eşikleme<br />

algoritması (Otsu, 1979) bu değişken eşik seviyesini bulmak için kullanılır. Bulunan<br />

eşik seviyesi [0,1] aralığında, parlaklık parametresidir. Bu eşik değerini bulduktan<br />

sonra ise gri resim, siyah beyaza çevrilir.<br />

Otsu’nun bölgesel eşikleme algoritması; kendi içinde ağırlıklandırılmış ve<br />

sınıflandırılmış değişintiyi (varyansı) minimize edecek şekilde çalışır. Bu sınıfların<br />

birbiri ile olan değişintisini ise maksimize edecektir. Bölgesel eşikleme algoritması,<br />

gri skala resimlerinde (0, 256) arasında değer alan pikseller için, P(i) çalışır.<br />

Sınıfların birbiri arasındaki değişintisi:<br />

σ ( t) = q ( t) σ ( t) + q ( t) σ ( t)<br />

(2.3)<br />

2 2 2<br />

w 1 1 2 2<br />

16


Tahmin edilen sınıfsal olasılıklar<br />

t I<br />

∑ ∑ (2.4)<br />

q ( t) = P( i) q ( t) = P( i)<br />

1 2<br />

i= 1 i=<br />

1+ 1<br />

Sınıfların ortalamaları:<br />

t I<br />

iP( i) iP( i)<br />

µ ( t) = µ ( t)<br />

=<br />

q ( t) q ( t)<br />

∑ ∑ (2.5)<br />

1 2<br />

i= 1 1 i= t+<br />

1 2<br />

Ve son olarak sınıfların değişintisi:<br />

P( i)<br />

t<br />

2<br />

2<br />

( t) = ( )<br />

1 ∑ ⎡<br />

⎣i − t ⎤ 1 ⎦<br />

(2.6)<br />

i=<br />

1 q ( t)<br />

1<br />

σ µ<br />

P( i)<br />

I<br />

2<br />

2<br />

( t) = ( )<br />

2 ∑ ⎡<br />

⎣i − t ⎤ 2 ⎦<br />

(2.7)<br />

i= t+<br />

1 q ( t)<br />

2<br />

σ µ<br />

t değerleri içinden (1,256 aralığı) en küçük σ ( ) değerini verenler seçilir.<br />

Toplam değişinti, belirlenen eşik seviyesinden bağımsızdır. Sınıfların birbiri<br />

arasındaki değişintisi ile sınıflar arası değişintinin toplamıdır.<br />

17<br />

w t<br />

2 2<br />

σ = σ ( t) + q ( t) ⎡1 q ( t) µ ( t) µ ( t)<br />

w 1 ⎣ − ⎤ ⎡ ⎤<br />

1 ⎦ ⎣ − 1 2 ⎦ (2.8)<br />

Ağırlıklandırılmış<br />

değişinti<br />

Yukarıdaki formülden bakıldığında ağırlıklandırılmış değişinti değerinin azaldığı<br />

durumda sınıflar arası değişintinin artacağı daha net bir biçimde ifade edilmektedir.<br />

Sınıflar arası değişintinin değerleri; t değerleri iteratif olarak formülde yerine<br />

konarak hesaplanabilir.<br />

İterasyonun Başlangıcı:<br />

q (1) = P (1); µ (0) = 0<br />

(2.9)<br />

1 1<br />

Sınıflar arası değişinti: σ<br />

2<br />

2<br />

( ) B t


Tekrarlayan Kısım için:<br />

q ( t + 1) = q ( t) + p( t + 1)<br />

(2.10)<br />

1 1<br />

q ( t) µ ( t) + ( t + 1) P( t + 1)<br />

1 1<br />

µ ( t + 1) =<br />

1<br />

q ( t + 1)<br />

µ − q ( t + 1) µ ( t + 1)<br />

1 1<br />

µ ( t + 1) =<br />

2<br />

1 − q ( t + 1)<br />

2.2. Geometrik Dönüşümler<br />

1<br />

1<br />

18<br />

(2.11)<br />

(2.12)<br />

İşlenmemiş görüntüler genellikle geometrik bozulmaları içerir. Bu çalışmada, 2-D<br />

veya N-D boyutlar için kullanılan affine dönüşümüne ait bazı geometrik dönüşümler<br />

Çizelge 2.1’de gösterilmiştir.<br />

Çizelge 2.1 Geometrik dönüşümler<br />

Affine Dönüşümü Örnek Dönüşüm Matrisi<br />

Translation<br />

(Yer değiştirme)<br />

Ölçekleme<br />

(skalama)<br />

Shear<br />

Döndürme<br />

⎡1 0 0⎤<br />

⎢ ⎥<br />

⎢0 1 0⎥<br />

⎢tx t y 1⎥<br />

⎣ ⎦<br />

⎡sx 0 0⎤<br />

⎢<br />

0 sy<br />

0<br />

⎥<br />

⎢ ⎥<br />

⎢⎣ 0 0 1⎥⎦<br />

⎡ 1 shy<br />

0⎤<br />

⎢<br />

shx<br />

1 0<br />

⎥<br />

⎢ ⎥<br />

⎢⎣ 0 0 1⎥⎦<br />

⎡ cos( q) sin( q)<br />

0⎤<br />

⎢<br />

sin( q) cos( q)<br />

0<br />

⎥<br />

⎢<br />

−<br />

⎥<br />

⎢⎣ 0 0 1⎥⎦<br />

tx : x ekseni boyunca yer<br />

değiştirme<br />

ty : y ekseni boyunca yer<br />

değiştirme<br />

sx: x ekseni boyunca<br />

ölçekleme değeri<br />

sy: y ekseni boyunca<br />

ölçekleme değeri<br />

shx: x ekseni boyunca<br />

shear değeri<br />

shy: y ekseni boyunca<br />

shear değeri<br />

q: dönme açısı


2.3. Bölgelerin Etiketlenmesi<br />

İkilik bir resim içerisinde birbiri ile hiçbir piksel komşuluğu olmayan nesnelerin<br />

değişik renklere boyanması ile resim içerisindeki bu nesnelerin birbirinden ayrılması<br />

işlemine etiketleme (labeling) denir (Karaman, 2001).<br />

Etiketleme işlemini gerçekleştirmek için, ikili seviyedeki bir resmin (0,0) orjin<br />

noktasından itibaren yani sol üst köşesinden başlamak suretiyle piksel piksel taranır.<br />

Taranan resimdeki nesneler beyaz, artalan ise siyah renkte olan bu ikilik resimde<br />

tarama esnasında beyaz bir piksele rastlandığında, bu pikselin tüm komşuluklarına<br />

bakılır. Ve komşulukları arasında önceden etiketlenmiş başka bir piksel varsa bu<br />

beyaz piksele de aynı etiket atanır. Eğer bu beyaz pikselin komşuları arasında<br />

birbirinden farklı etiketlere sahip birden fazla piksel varsa bu etiketlerden en küçük<br />

değerlere sahip olanı bu beyaz piksele etiket değeri olarak atanır. Aynı zamanda<br />

birbirine komşu oldukları halde farklı etiket değerleriyle etiketlendirilmiş olan<br />

piksellere ait etiketler bir eşitlik tablosunda birbirine eşitlenir. Böylelikle bu<br />

piksellerin etiket değerleri farklı olsa da, aslında bu piksellerin aynı nesnenin bir<br />

parçası olduğu eşitlik tablosunda belirtilmiş olur. Eşitlik tablosundaki bu bilgiler bir<br />

sonraki tarama işleminde kullanılmak üzere saklanır (Oral, 1996). Eğer tarama<br />

esnasında rastlanan beyaz etiketlenmemiş pikselin komşuları arasında daha önceden<br />

etiketlenmiş bir piksel yoksa bu piksele yeni bir etiket değeri atanır. Böylece bu<br />

pikselin yeni bir nesneye ait bir piksel veya daha önceden etiketlendirilmiş bir<br />

nesnenin alt çıkıntılarından birine ait bir piksel olduğuna karar verilmiş olur.<br />

Tarama bu şekilde resmin tamamını kapsayacak biçimde yapılır. Tarama sonunda<br />

eşitlik tablosunda hangi etiketlerin aslında aynı nesneyi temsil ettiği eşitlik<br />

tablosundaki bilgiler ışığında tespit edilir. Bu yeni veriler göz önünde tutularak resim<br />

baştan sona tekrar taranır ve eşitlik tablosunda aynı nesneye verilen değerler arasında<br />

19


en küçük değere sahip olan pikselin etiketi, aynı nesnenin tüm piksellerine etiket<br />

değeri olarak atanır. Bu işlem tüm resim taranacak şekilde yapılır. Tarama işlemi<br />

tamamlandıktan sonra resim içerisinde birbirlerine piksel komşulukları olmayan tüm<br />

nesneler farklı bir renge boyanmış, yani etiketlendirilmiş olur.<br />

Etiketleme işlemi sonunda elde edilen resim içerisinde kullanılan farklı etiketlerin<br />

adetinin sayısının tespiti bize o resim içerisinde toplam (birbirine piksel komşuluğu<br />

olmayan) nesne olduğunu bildirir. Böylelikle resim içerisindeki nesneleri otomatik<br />

olarak saydırmış oluruz.<br />

2.4. Morfolojik İşlemler<br />

Morfolojik imge işlemede temel olarak kullanılan iki işlem vardır: Genişletme<br />

(dilation) ve Aşındırma (erosion). Diğer morfolojik işlemler, bu temel iki işlem<br />

kullanılarak elde edilir.<br />

Genişletmek (Yayma): İkili imgedeki nesneyi büyütmeye ya da kalınlaştırmaya<br />

yarayan morfolojik işlemdir. Sayısal bir resmi genişletmek demek resmi yapısal<br />

elemanla kesiştiği bölümler kadar büyütmek demektir. Kalınlaştırma işleminin nasıl<br />

yapılacağı yapı elemanı (structure element) belirler. Yapısal eleman resim üzerinde<br />

piksel piksel dolaştırılır. Eğer yapısal elemanın orjini resim üzerinde "0" değerli bir<br />

piksel ile karşılaşırsa herhangi bir değişiklik meydana gelmez. Eğer değeri "1" olan<br />

bir piksel ile karşılaşırsa yapısal elemanla yapısal elemanın altında kalan pikseller<br />

mantıksal "veya" işlemine tabi tutulurlar. Yani herhangi "1" değeriyle sonuç "1" e<br />

çevrilir. Genişletme ile resim üzerindeki nesneler şişer. Nesne içinde delikler var ise<br />

bunlar kapanma eğilimi gösterirler. Ayrık nesneler birbirine yaklaşır ya da bağlanır.<br />

Şekil 2.1’de 3x3 yapısal elemanı ile sayısal resim üzerine genişletme işleminin<br />

uygulanması gösterilmiştir. 3x3 lük yapısal elemanın tüm değerleri "1" dir.<br />

20


Şekil 2.1 Genişletme işlemi<br />

Aşındırma işlemi, ikili imgedeki nesneyi küçültmeye ya da inceltmeye yarayan<br />

morfolojik işlemdir. Aşındırma işlemi bir bakıma genişletmenin tersi gibi görülebilir.<br />

Burada yine aynı şekilde yapısal eleman resim üzerinde piksel piksel dolaştırılır fakat<br />

bu defa yapısal elemanın merkez pikseli "1" değeri ile karşılaşırsa yapısal eleman<br />

içerisindeki piksellerin durumuna bakılır. Eğer yapısal eleman içerisindeki "1" olan<br />

piksellerden herhangi biri altında resme ait "0" değeri varsa yapısal elemanın diğer<br />

"1" lerinin altındakilerle beraber bu piksel "0"’a dönüştürülür.<br />

Aşındırma (erozyon, erosion) işlemi ile sayısal resim aşındırılmış olur. Yani resim<br />

içerisindeki nesneler ufalır, delik varsa genişler, bağlı nesneler ayrılma eğilimi<br />

gösterir.<br />

Şekil 2.2’de 3x3 yapısal elemanı ile sayısal resim üzerine aşındırma uygulanması<br />

gösterilmiştir. 3x3 lük yapısal elemanın tüm değerleri "1" dir.<br />

Şekil 2.2 Aşındırma işlemi<br />

21


Açma işlemi, sayısal bir resme önce aşındırma daha sonra genişletme uygulanırsa<br />

resme açma işlemi uygulanmış olur. Açma işlemine tabi tutulmuş bir görüntü ve<br />

değişimi Şekil 2.3’de gösterilmiştir. Burada yine 3x3 lük yapısal eleman<br />

kullanılmıştır.<br />

Şekil 2.3 Açma işlemi<br />

Kapatma işlemi, sayısal resme önce genişletme daha sonra aşındırma uygulanırsa<br />

Kapatma işlemi uygulanmış olur. Şekil 2.4‘de kapatma işlemi uygulanmış bir<br />

görüntünün önce ve sonrası durumları incelenmiştir.<br />

Şekil 2.4 Kapatma işlemi<br />

Açma işlemi ile birbirine yakın iki nesne görüntüde fazla değişime sebebiyet<br />

vermeden ayrılmış olurlar. Kapatmada ise birbirine yakın iki nesne görüntüde fazla<br />

değişiklik yapılmadan birbirine bağlanmış olur.<br />

A ⊕ B ↔Genişletme<br />

A Θ B ↔ Aşındırma<br />

22


A o B = ( A Θ B ) ⊕ B ↔ Açma işlemi<br />

A ● B = ( A ⊕ B ) Θ B ↔ Kapama işlemi<br />

Yapısal eleman, birçok morfoloji işleminin gerçekleştirilmesinde en önemli öğedir.<br />

Sayısal resimler matematiksel ifade oldukları için matematiksel morfoloji özellikleri<br />

kullanılır.<br />

Aslında yapısal eleman olarak adlandırılan ifade istenilen boyutlarda ve istenilen<br />

şekilde hazırlanmış küçük ikilik bir resimdir. Yapısal eleman çeşitli geometrik<br />

şekillerden biri olabilir; en sık kullanılanları kare, dikdörtgen ve dairedir. Yapısal<br />

eleman örnekleri Şekil 2.5’de gösterilmektedir.<br />

Şekil 2.5 Yapısal eleman örnekleri<br />

Yapısal elemanın merkez pikselinin ikili seviyede bir resim içerisindeki nesnelere (1<br />

lere) temas etmesiyle ortaya çıkan nesne ile yapısal elemanın kesişim kümesi<br />

"nesneden çıkartılarak" veya "nesneye eklenerek" birçok morfolojik işlem<br />

gerçekleştirilir. Buradaki en önemli nokta nesneye eklenen ya da nesneden çıkarılan<br />

kısmın yapısal eleman tarafından belirlenmesidir.<br />

Eğer morfolojik işlemin sonucunda resimdeki nesnelerin keskin hatları silinip<br />

yerlerine kavisli veya daha yumuşak hatlar getirilmek isteniyorsa dairesel yapısal<br />

eleman kullanılmalıdır. Örneğin erozyon işleminde resim içerisindeki nesnelerin en<br />

ve boyları aynı oranda azaltılmak (erozyona uğratılmak) isteniyorsa yapısal eleman<br />

kare seçilmelidir.<br />

23


Gri seviyeli morfolojik işlemler: Gri seviyeli bir görüntünün b yapısal elemanı ile<br />

genişletme işlemi denklem (2.13) ile ifade edilir (Gonzalez ve Woods, 1993).<br />

( )( ) max{ ( ',<br />

')<br />

( ',<br />

')<br />

| ( ',<br />

' )} D y x y x b y y x x f y x b f ∈<br />

+ − − =<br />

⊕ , b (2.13)<br />

Burada Db: b’nin etki alanıdır. Genişletme işleminden sonra resim genelde daha<br />

parlaktır.<br />

Şekil 2.6 Gri seviyedeki genişleme işlemi<br />

Gri skalalı aşındırma işlemi (2.14) denklem ile ifade edilir. Aşındırma işleminden<br />

sonra resim genelde daha koyudur.<br />

( )( ) min{ ( ',<br />

')<br />

( ',<br />

')<br />

| ( ',<br />

' )} D y x y x b y y x x f y x b f ∈<br />

+ − − =<br />

Θ (2.14)<br />

, b<br />

Şekil 2.7 Gri seviyedeki aşındırma işlemi<br />

24


( fΘb)<br />

b<br />

f � b = ⊕ ↔ Açma<br />

( f ⊕b)<br />

b<br />

f • b = Θ ↔ Kapama<br />

Doldurma işlemi: Doldurma işlemi gri skaladaki bir resimde bulunan boşlukları<br />

kapatmak için kullanılan morfolojik işlemlerin yeniden oluşturulmasıyla<br />

(reconstruction) meydana gelen bir algoritmadır.<br />

Yeniden oluşturulma işlemi: Bir resim ve yapısal elemandan ziyade işaretleyici<br />

(marker) ve maske (mask) olmak üzere iki resme bağlı olarak elde edilir. İşlemler,<br />

kararlılık sağlanıncaya kadar tekrar eder, resim artık değişmez.<br />

L ve I iki gri skalalı resim olsun, piksel değerleri {0,1,…,N} kümesinden seçilmiş<br />

olsun ve J


işlemler kullanılarak elde edilir. Tepe veya çukur bölgeleri belirginleştirme<br />

özelliğine sahiptir (Karp, 2005).<br />

Aydınlık nesneler için,<br />

TopHat [A, B] = A - (A○B) (2.16)<br />

karanlık nesneler için de,<br />

TopHat[A, B] = (A●B) - A (2.17)<br />

verilmiştir. Burada,<br />

B : Yapı elemanı<br />

(a) Orijinal görüntü<br />

Şekil 2.9 TopHat dönüşümün aydınlık ve koyu nesneler için parlaklık gösterimi<br />

Şekil 2.9.a’da orijinal görüntünün pozisyona göre parlaklık değeri görülmektedir. Bu<br />

görüntüye TopHat uygulanmasıyla Şekil 2.9.b,c’de aydınlık ve koyu nesneler için<br />

ayrı ayrı elde edilen parlaklık değişimleri gösterilmiştir.<br />

26


TopHat dönüşümü, açma veya kapama işlemleri uygulanmasıyla elde edilir; aydınlık<br />

nesneler için, orijinal resimden açma işleminin çıkarılması ile karanlık nesneler<br />

içinse kapama işleminin orijinal resimden çıkarılmasıyla. Şekil 2.10’da her iki durum<br />

için top-hat dönüşümü işlemleri gösterilmiştir (Candeas, 1997).<br />

Şekil 2.10 Top-Hat dönüşümünün elde edilmesi: a,e) yapı elemanı; b,f) orijinal<br />

resim; c,g) açma (diğeri kapama); d,h) çıkarma sonucu<br />

Şekil 2.10.c’de f orijinal sinyale düz yapı elemanıyla (Şekil 2.10.a) uygulanan açma<br />

işlemi görülmektedir. Şekil 2.10.d’de orijinal resimden açma işlemi uygulanmış<br />

resmin çıkarılmasıyla elde edilen tepe noktalarının saptanması gösterilmiştir. Şekil<br />

2.10.b’de de kapama işleminden orijinal resimden çıkarılmasıyla çukur bölgelerin<br />

saptanması görülmektedir.<br />

2.6. Hough Dönüşümü<br />

Hough Dönüşümü sayısal görüntü işlemede matematiksel olarak ifade edilebilen<br />

şekillerin varlığının, yerinin, açılarının vs bulunmasında kullanılabilir. Yöntem 1962<br />

yılında Paul Hough tarafından bulunmuştur. IBM tarafından patentlidir.<br />

Yöntem daha çok resimdeki doğruların tespitinde kullanılır ancak genelleştirilmiş<br />

Hough dönüşümü matematiksel olarak ifade edilebilen bütün şekillerde çalışır.<br />

27


Şekil 2.11 Hough Dönüşüm metodu ile doğruların bulunması<br />

Bu çalişmada, Hough Dönüşüm metodu ile doğru bulunması ve metodun algoritması<br />

incelenecektir.<br />

Hough Dönüşüm yöntemi Edge (kenar) bilgisi elde edilmiş Gri-seviye imgeler<br />

üzerine uygulanır. Yöntem imge uzayındaki bilgiyi parametre uzayına taşıyarak şekil<br />

bulma problemini bir yoğunluk bulma problemine dönüştürür.<br />

Bir doğru genel olarak,<br />

y = ax + b<br />

(2.18)<br />

şeklinde ifade edilir. Parametre uzayında her farklı (a,b) çifti farklı bir doğruyu<br />

temsil etmektedir. Bu gösterimle dikey doğrular ifade edilemez.<br />

Doğruyu ifade etmenin bir başka yöntemi:<br />

x.cos Θ + y.sin Θ – p = 0<br />

(2.19)<br />

şeklindedir. ( p : ifade edilen doğruya orjinden çizilen dikme)<br />

28


y<br />

)Θ x<br />

Şekil 2.12 Bir doğrunun ifadesi<br />

Her farklı (Θ,r) çiftimiz farklı bir doğruyu ifade etmektedir. Görüntü üzerindeki her<br />

noktadan farklı (Θ,r) şeklinde ifade edilebilen sonsuz sayıda doğru geçer. Parametre<br />

uzayında (x,y) şeklinde olan noktamızı her farklı Θ ye karşı gelen p şeklinde çizersek<br />

bu noktayı ifade eden bir sinus eğrisi elde ederiz.<br />

(a) (b)<br />

Şekil 2.13 (a) Sinüs eğrisi, (b) Kesişen noktalar<br />

Bütün noktalarımıza bu yöntemi uygularsak eğrilerimiz Şekil 2.13.b’de görüldüğü<br />

gibi bazı noktalarda kesişecektir. Bu kesişim noktaları aynı Θ ya karşılık gelen aynı<br />

p’lerdir. Yani farklı noktaların oluşturduğu aynı doğrulardır. (Bir doğru üzerindeki<br />

faklı noktalar).<br />

y = ax + b<br />

x cos Θ + y sin Θ = p<br />

p<br />

29<br />

( Θ,<br />

p)<br />

Θ


Şekil 2.14 Kesişen doğruların grafiksel gösterilmesi<br />

Şekil 2.14’deki grafikte bir noktadan geçen sinüs eğrilerinin sayısının fazla olması o<br />

noktanın bir doğru ifade etmesi ihtimalini güçlendirir. Buradaki darbe bölgeleri<br />

doğruların bulunduğu bölgelerdir.<br />

2.7. Karakter Tanıma<br />

Bilgisayarın, bir resmin içindeki bilgiyi kullanabilmesi için yorumlaması<br />

gerekmektedir. Başka bir deyişle, karakter tanıma, bir resimdeki yazıların<br />

bilgisayarın anlayacağı, daha kolay ve verimli saklayıp, bulabileceği sembollere<br />

çevrilmesidir.<br />

Ön işleme algoritmaları, ihtiyaç duyulan verileri, ileriki aşamalar için uygun hale<br />

getirmeyi sağlar. Diğer bir değişle, gerçek dünya ile tanıma motorları arasındaki<br />

köprüyü sağlar.<br />

2.7.1 Karakter Tanıma Ön İşlemler<br />

Karakter tanıma işlemi genel olarak ön işlemleri gerektirmektedir. Ön işlemlerden<br />

bazıları eşikleme, inceltme, onarma ve normalleştirmedir.<br />

30


Şekil 2.15 Karakter ön işlemleri<br />

2.7.1.1 Eşikleme<br />

Eşikleme giriş karakterinin ikilik görüntüsünü elde etmek için kullanılır.<br />

2.7.1.2 İnceltme<br />

İnceltme (iskelet alma ya da skeleton) işlemi ikilik bir resme aşağıdaki 8 yapısal<br />

elemanın uygulanması ile yapılır. Ve bu uygulamalar kaynak görüntüde ciddi bir<br />

değişikliğe sebebiyet vermeyene kadar tekrarlanır.<br />

0 0 0 X 0 0 1 X 0 X 1 X 1 1 1 X 1 X 0 X 1 0 0 X<br />

X 1 X 1 1 0 1 1 0 1 1 0 X 1 X 0 1 1 0 1 1 0 1 1<br />

1 1 1 X 1 X 1 X 0 X 0 0 0 0 0 0 0 X 0 X 1 X 1 X<br />

Şekil 2.16 İnceltme işlemi için yapısal elemanlar<br />

Burada X durumu önemli değildir. X ne olursa olsun aynı sonuç alınacaktır.<br />

Şekil 2.17’de inceltilme öncesi ve sonrası farklı tonlar ile gösterilmiş aslında ikilik<br />

seviyede olan bir resim örneği yer almaktadır. Gri ile gösterilmiş (aslında resmin ilk<br />

hali olan) alanlar inceltme işlemi sonrasında siyah olarak ifade edilmişlerdir.<br />

Şekil 2.17 İnceltme işlemi<br />

31


İnceltme işlemi tanıma işlemini daha kolay ve hızlı bir hale getirir. Ayrıca<br />

oluşabilecek hataları en aza indirir. Çerçevelenmiş karakterdeki bilgi taşıyan siyah<br />

piksel sayısını en aza indirdiği için, isleme sokulacak nokta sayısı azalmış olur. Bu<br />

da program hızını artırır.<br />

2.7.1.3 Onarım<br />

Onarım işleminde, kalınlaştırma işlemi kullanılarak kopuk çizgilerin birleştirilmesi,<br />

eğri ve doğruların biçimlerinin düzenlenmesi sağlanır. Morfolojik işlem uygulanarak<br />

elde edilir.<br />

2.7.1.4 Normalleştirme<br />

Normalleştirme, yazı karakterlerinden kaynaklanan farklılıkların ortadan kaldırılarak<br />

standart bir şekle getirilmesidir. Genellikle karakter geometrisindeki değişim olarak<br />

tanımlanabilir. Değişimler, pozisyon, boyut ve konumda olabilir. Örneğin 12x7 ve<br />

14x8 boyutlarında bir karakterin 25x25 bir alana taşınması bir normalleştirme<br />

(ölçekleme) işlemidir. Böylece, karakter belli bir standart ölçüye getirilir<br />

2.7.2 Korelasyon ile Karakter Tanıma<br />

Tek başına, sabit boyutlu, düzlemle açısı sıfır olan karakterleri tanımak için etkili bir<br />

yöntemdir (Kittler, Pattern Recognition, 1988). Iki rastlantısal değişkenin birbiri ile<br />

doğrusal olarak benzerliğinin bir ölçüsüdür.<br />

Burada;<br />

ρ<br />

X , Y<br />

cov( X , Y ) E(( X − µ )( Y − µ ))<br />

X Y<br />

= = (2.20)<br />

σ σ σ σ<br />

X Y X Y<br />

ρ : X,Y’nin korelasyonu<br />

X , Y<br />

µ : Beklenen değer<br />

X<br />

σ : Standart sapma<br />

X<br />

32


E :Değişkenlerin beklenen değeri<br />

cov :Kovaryans<br />

2 2 2<br />

µ = E( X ) ve σ = E( X ) − E ( X ) olarak yazılabildiğinden, yukarıdaki eşitlik şu<br />

X<br />

X<br />

şekilde de yazılabilir:<br />

ρ<br />

X , Y<br />

=<br />

E( XY ) − E( X ) E( Y )<br />

E X − E X E Y − E Y<br />

2 2 2 2<br />

( ) ( ) ( ) ( )<br />

33<br />

(2.21)<br />

Korelasyon, standart sapma değerlerinin sıfırdan farklı ve sonlu olması durumunda<br />

hesaplanabilir. Birbiri ile ilintisi olmayan iki değişkenin korelasyon sonucu “0”dır.<br />

Benzerliğin alabileceği maksimum değer “1”dir.<br />

2.7.3 Destek Vektör Makineleri Ve Öğrenme Metodolojisi<br />

2.7.3.1 Lineer Öğrenme Makineleri<br />

Makinelerin öğrenebilme yetenekleri uzun yıllardan beridir insanların merakını alan<br />

bir konudur. Sistemlerin öğrenebilme yetenekleri, herhangi bir matematiksel modeli<br />

olmayan problemlerin çözümünde önemli bir yer tutmaktadır.<br />

2.7.3.1.1 Lineer Sınıflandırma<br />

n<br />

İkili sınıflandırma sıklıkla bir f : x ⊆ R → R gerçek-değerli fonksiyonu şu şekilde<br />

uygulanarak yapılır: x=(x1, x2, … , xn) girişi eğer f(x) ≥0 pozitif sınıfa, değilse<br />

negatif sınıfa atanmıştır. f(x), x ∈ X ’in bir lineer fonksiyonu ise,<br />

f ( x) = 〈 w. x〉 + b<br />

n<br />

∑<br />

f ( x) = w x + b<br />

i=<br />

1<br />

olarak yazılabilir.<br />

i i<br />

(2.22)


n<br />

Burada ( w, b) ∈ R * R parametreleri, fonksiyonu ve sgn(f(x)) ile verilen karar<br />

kuralını kontrol eder (sgn(0)=1). Öğrenme metodolojisi bu parametrelerin, veriden<br />

öğrenilmesi gerektiğini belirtir.<br />

Şekil 2.18 İki boyutlu eğitim seti için bir (w,b) ayırıcı hiperdüzlemi<br />

Bu tür bir varsayımın geometrik bir açıklaması X giriş uzayının +b = 0 eşitliği<br />

ile tanımlanan hiperdüzlem ile ikiye bölündüğüdür. Bir hiperdüzlem iki ayrı sınıfı<br />

barındıran uzayı ikiye böler. Şekil 2.18’deki hiperdüzlemin üst kısmı pozitif bölgeyi,<br />

alt kısmı ise negatif bölgeyi gösterir. X vektörü hiperdüzleme dikey bir yön tanımlar.<br />

b’nin değişen değeri hiperdüzlemi kendisine paralel taşır. w ve b nicelikleri nöral ağ<br />

literatüründeki gibi ağırlık vektörü ve bias (eğilim, verev) olarak kullanılacaktır.<br />

X giriş uzayını ve Y çıkış alanını gösterecektir. Genellikle<br />

34<br />

n<br />

x ⊆ R , ikili sınıflandırma<br />

için Y={-1,+1}, m-sınıflı sınıflandırma için Y={1, 2, … , m} ve regresyon için<br />

Y ⊆ R ’dir. Bir eğitim kümesi eğitim örneklerinden oluşmuştur ve bunlar eğitim<br />

verisi olarak adlandırılır. Genellikle<br />

(( , ),...( , )) ( * ) n<br />

S = x y x y ⊆ X Y<br />

(2.23)<br />

1 1<br />

n n<br />

olarak belirtilir. n : örnek sayısıdır.


xi’ler örnek, yi’ler ise etiketleri olarak gösterilir. S eğitim kümesi, eğer tüm<br />

örneklerin etiketleri eşit ise önemsizdir. Eğer x bir vektör uzayı ise giriş vektörleri<br />

ağırlık vektörleri olarak sütun vektörleridir.<br />

Bir (xi, yi) örneğinin sınırı (fonksiyonel), (w,b) düzlemi için<br />

γ = y ( 〈 w. x 〉 + b)<br />

(2.24)<br />

i i i<br />

şeklinde tanımlanır.<br />

γ > 0 , (xi, yi)’nin doğru sınıflandırmasını ifade eder. S eğitim kümesinin sınırı,<br />

i<br />

bütün hiperdüzlemlerin üzerindeki maksimum geometrik sınırdır. Bu en büyük<br />

değeri gerçekleştiren hiperdüzlem, en büyük sınır hiperdüzlemi olarak bilinir.<br />

Kendisinin sınırının boyutu, lineer ayrılabilen eğitim kümesi için pozitif olacaktır.<br />

2.7.3.1.2 Kernel Tabanlı Özellik Uzayı<br />

Kompleks gerçek-dünya uygulamaları lineer fonksiyonlardan daha anlamlı varsayım<br />

uzayları gerektirir. Kernel ifadeleri, lineer öğrenme makinelerinin hesapsal gücünü<br />

artırmak için veriyi yüksek boyutlu bir özellik uzayını düşürerek alternatif bir çözüm<br />

sunar. Lineer makinelerin ikili ifadedeki kullanımı bu adımı gerçekleştirmeyi<br />

mümkün kılar.<br />

2.7.3.1.3 Özellik Uzayları ve Kerneller<br />

Şekil 2.19, giriş uzayından özellik uzayına dönüşümü temel alan DVM’lerin temel<br />

fikrini göstermektedir.<br />

35


Giriş Uzayı Özellik Uzayı<br />

Şekil 2.19 Giriş uzayından özellik uzayına dönüşüm<br />

N<br />

Φ : R → F<br />

K( x, y) = ( Φ( x), Φ(<br />

y))<br />

36<br />

(2.25)<br />

Eğer F yüksek-boyutluysa yukarıdaki eşitliğin sağ tarafının hesabı çok uğraştırıcı<br />

olacaktır. Bununla birlikte hesabı verimli kılan kerneller mevcuttur. Örneğin<br />

polinomal kernel;<br />

K(x,y) = (x,y) d (polinomal kernel) (2.26)<br />

d=2 ve<br />

x, y R<br />

2<br />

2<br />

∈ için, örneğin ( x, y) ( ( x). ( x))<br />

2 2<br />

1 1 2 2<br />

= Φ Φ oluyorsa;<br />

Φ ( x) = ( x , 2 x x , x ) olacaktır. (2.27)<br />

Polinomal kernelin yanı sıra en çok kullanılan kerneller sigmoid kernel, RBF (Radial<br />

Basis Function) kernelleridir.<br />

K( x, y) = tanh( κ(<br />

x. y) + Ф))<br />

Sigmoid Kernel (2.28)<br />

2 2<br />

K( x, y) = exp( − || x − y || /(2 σ )) RBF Kernel (2.29)<br />

2.7.3.1.4 Özellik Uzayında Öğrenme<br />

Öğrenilecek hedef fonksiyonun karmaşıklığı gerçekleştirme yoluna dayanır ve<br />

bundan dolayı öğrenme işinin zorluğu değişir. İdeal olarak spesifik öğrenme


problemine uyan ifade seçilebilir. Dolayısıyla makine öğrenmesinde yaygın bir<br />

önişleme stratejisi verinin ifadesinde değişim içerir.<br />

x = ( x ,..., x ) → Φ ( x) = ( Φ ( x),..., Φ ( x))<br />

(2.30)<br />

1 n 1<br />

N<br />

(2.29) ifadesi X giriş uzayını yeni bir uzaya haritalamaya eşittir.<br />

F = { Φ( x) | x ∈ X}<br />

(2.31)<br />

Veriyi başka bir uzaya haritalamak, makine öğrenmesindeki işi çok basitleştirir ve<br />

verinin en iyi ifadesinin seçimi için teknik sayısını artırır. Veriyi anlatmak için<br />

tanıtılan nicelikler genellikler özellik olarak adlandırılır, en uygun ifadeyi seçme işi<br />

ise özellik seçimi olarak bilinir. X uzayı giriş uzayı olarak alınır ve<br />

F = { Φ( x) | x ∈ X}<br />

özellik uzayı olarak adlandırılır.<br />

Şekil 2.20 iki boyutlu bir giriş uzayından, iki boyutlu bir özellik uzayına haritalamayı<br />

gösteren bir örnektir. Veri giriş uzayında lineer bir fonksiyonla ayrılamazken, özellik<br />

uzayında ayrılabilir.<br />

Şekil 2.20 Sınıflandırma işini basitleştiren bir özellik haritası<br />

2.7.3.1.5 Vapnik ve Chervonenkis (VC) Teorisi ve VC Boyutu<br />

Lineer ve nonlineer DVM ifadelerinde, sınır (margin) ifadesinin büyük bir rol<br />

oynadığı görülür.<br />

φ(.)<br />

37<br />

φ( )<br />

φ( )<br />

φ( ) φ( )<br />

φ( ) φ( ) φ( )<br />

φ( )<br />

φ( ) φ( )<br />

φ( )<br />

φ( )<br />

φ( ) φ( )


VC boyutu genellikle h ile ifade edilir. VC boyutu sınıflandırma fonksiyonlarının<br />

kapasitesini ölçer. Fonksiyonlar kümesi için bir VC boyutu h ile parçalanan eğitim<br />

örneklerinin maksimum sayısı olarak tanımlanır.<br />

iF ( x, w) ∈ {0,1} ya da iF ( x, w) ∈{ − 1,1}<br />

(2.32)<br />

iF gösterge fonksiyonlarını belirten bir ifadedir. İki sınıflı sınıflandırma işlemlerinde<br />

i ( x, w ) gösterge fonksiyonlarının bir kümesinin VC boyutu, bütün olağan<br />

F<br />

durumlarda ayrılabilecek noktaların en büyük h sayısını gösterir. İki sınıflı örüntü<br />

tanıma problemlerinde, n tane nokta kümesi 2 n mümkün yolla etiketlenebilir. Eğer<br />

kümenin üyeleri, bütün etiketleri doğru olarak işaret ediyorsa, bu fonksiyonlar<br />

kümesinin VC boyutu h=n’dir<br />

İki boyutlu sınıflandırma problemlerinde, R 2 (x1,x2) özellik uzayında, hiperdüzlemin<br />

bir tarafındaki bütün noktalar +1, diğer tarafındaki noktalar da -1 değerini alır.<br />

Üç noktanın bir hiperdüzlem tarafından nasıl ayrıldığı 2 3 =8 şeklinde hesaplanır.<br />

Bir n-boyutlu giriş uzayında, yönlü hiperdüzlem gösterge fonksiyonunun VC boyutu<br />

h=n+1 (2.33)<br />

olarak hesaplanır.<br />

VC boyutu istatistiksel öğrenme teorisindeki bütün sonuçlarda kullanılır. Kolay bir iş<br />

değildir. Bu nicelik, spesifik tahmin fonksiyonuna ve çözülecek öğrenme<br />

probleminin tipine bağlıdır (sınıflandırma veya regresyon problemlerinden biridir).<br />

2.7.3.1.6 Langrangian Teorisi<br />

Langrangian teorisinin amacı başlangıçta hiçbir eşitsizlik sabiti olmayan bir<br />

optimizasyon probleminin çözümünü karakterize etmektedir. Bu teorinin ana<br />

38


konsepti Langrangian çarpanları ve Langrangian fonksiyonudur. Bu metot 1797’de<br />

mekaniksel problemler için Langrange tarafından geliştirilmiştir.<br />

f(w) amaç fonksiyonlu ve hi(w)=0, i=1,…,m eşitlik sabitli verilen bir optimizasyon<br />

problemi için<br />

m<br />

L( w, β ) = f ( w) +∑ β h ( w)<br />

(2.34)<br />

i=<br />

1<br />

i i<br />

Langrangian fonksiyonudur ve β i katsayılarını Langrangian çarpanları olarak<br />

adlandırılır.<br />

2.7.3.2 Destek Vektör Makineleri (Support Vector Machines)<br />

Destek Vektör Motoru - DVM bir öğrenme algoritması olarak Vapnik tarafından<br />

geliştirilen İstatiksel Öğrenme Teorisi (Vapnik, 1998) nin bir uygulaması olarak<br />

ortaya çıkmıştır. DVM’ler yapısal risk minimizasyon prensibi etrafında<br />

formülleştirilmiştir. Beklenen riskin üst sınırını küçüklemeye çalışır.<br />

Destek Vektörü öğrenme iki bakımdan çok kullanışlıdır. Birincisi Destek Vektörü<br />

öğrenme basit fikirler üzerine kurulmuştur. İkincisi yüksek performanslı pratik<br />

uygulamalarda kullanılabilir (Yıldırım, 2006).<br />

DV algoritması öğrenmesi teorisinin ve pratiğinin kesiştiği bir uygulamadır; bazı<br />

belirli algoritma tipleri için istatistiksel öğrenme teorisinde hesaplamaların başarılı<br />

olması için faktörler tam olarak istenir. Gerçek dünya uygulamaları, sık sık teorik<br />

olarak çözülmesi zor ve kompleks olan uygulamalardır. DV algoritması iki zorluğu<br />

da basitçe kaldırabilir. Yeterince kompleks olan modellere çözüm getirebilir.<br />

Matematiksel olarak analizi basittir, çünkü nonlineer giriş uzayındaki verileri<br />

dönüşümler yaparak özellik uzayına düşürür ve çözüm kolaylaşır.<br />

39


Özellikle iki sınıflı sınıflandırma probleminde DVM iki sınıf arasındaki sınırı<br />

büyükleyen optimal ayırt etme yüzeyini belirlemekte, yani eğitim kümesi ile ayırt<br />

etme yüzeyine en yakın noktaların arasındaki mesafeyi en büyüklemektir. Ayrıca,<br />

optimal ayırt etme yüzeyi, destek vektörleri olarak adlandırılan veri noktaların küçük<br />

bir kümesinde merkezlenmiş kernel fonksiyonların doğrusal bir kombinasyonu<br />

olarak ifade edilmektedir. Genelde destek vektörleri çok az miktarda olduğu için<br />

optimal ayırt etme yüzeyinin gösterimi seyrektir, bir anlamda veri noktalarının<br />

sadece bir bölümü sınıflandırma görevi ile ilgilidir. Buna ilaveten, doğrusal<br />

kombinasyon katsayıları doğrusal eşitsizlik ve kısıtları dahilinde bir konveks ikinci<br />

dereceli (quadratic) programlama probleminin çözümü ile belirlenmektedir. Çok<br />

katmanlı perseptron ve radyal tabanlı ağlar, uygun çekirdek fonksiyonları ile elde<br />

edilen DVM ağların özel durumları olarak gösterilebilir.<br />

2.7.3.2.1 En Büyük Sınırlı Sınıflandırma ve Lineer Destek Vektör Makineleri<br />

DVM’lerin en basit modeli en büyük sınırlı sınıflandırma olarak bilinmektedir.<br />

DVM’lerin bu kısmı sadece lineer olarak ayrılabilen özellik uzayı için geçerlidir. Bu<br />

nedenle, çoğu gerçek-dünya uygulamalarında kullanılması oldukça zor bir<br />

yöntemdir. Ama anlaşılması en kolay algoritmadır ve daha karmaşık DVM için temel<br />

kısmı inşa etmektedir. DVM için geçerli olan çoğu anahtar özellikleri içinde<br />

bulundurur.<br />

Giriş verilerinin kernel fonksiyonlarından geçirilip özellik uzayına düşürülmesi gerek<br />

yoktur. Sadece verileri birbirinden en iyi şekilde ayıran ve en büyük sınırlı<br />

sınıflandırmayı yapan hiperdüzlemi bulmak yeterli olacaktır.<br />

Hiperdüzlem tarafından ayıran veriler x + ve x - ise<br />

+<br />

〈 w. x 〉 + b = + 1<br />

(2.35)<br />

−<br />

〈 w. x 〉 + b = − 1<br />

(2.36)<br />

40


Sınıflandırıcının sınırı γ ile gösterilecek olursa;<br />

1 ⎛ w w ⎞<br />

+ −<br />

γ = ⎜ . x − . x<br />

2 ⎜<br />

⎟<br />

|| w || || w || ⎟<br />

1 1<br />

⎝ 2 2 ⎠<br />

1<br />

+ −<br />

= ( w. x − w. x )<br />

2 || w ||<br />

2<br />

2<br />

41<br />

(2.37)<br />

1<br />

= ifadesi geometrik sınırı verecektir. (2.38)<br />

|| w ||<br />

S = (( x , y ),...,( x , y )) ile verilmiştir bir lineer olarak ayrılabilen eğitim kümesinde<br />

n n<br />

optimizasyon problemini çözen (w,b) hiperdüzlemi en büyük değerli sınırlı<br />

hiperdüzleminde geometrik sınırı γ = 1/ || w || 2 olarak hesaplanır.<br />

2.7.3.2.2 Lineer Ayırt Edilebilir Sınıflar<br />

N boyutlu bir {( )} 1<br />

N<br />

S = x + y eğitim kümesi verilmiş olsun, burada i=1, 2 ,…, N<br />

i i i=<br />

için<br />

x R<br />

n<br />

i ∈ ve i<br />

y ∈{ − 1, + 1} . Diğer değişle, S’teki örneklerin iki sınıftan birine ait<br />

olduğu varsayılmıştır. Bununla beraber sınıfların hiperdüzlemin aynı tarafındaki bir<br />

sınıfın bütün elemanlarının yer aldığı bir hiperdüzlem ile ayırt edilebildiği kabul<br />

edilmiştir. Amaç iki sınıfı ayıran hiperdüzlemin eşitliğini bulmaktadır. Sınıflandırma<br />

için DVM yapısında çözümü zorlayan kısıt, optimal ayırt etme yüzeyinin eğitim<br />

kümesine en yakın noktalar ile birlikte mesafeyi büyüklemek zorunda olmasıdır. Bu<br />

kavramları daha anlaşılır hale getirmek amacıyla bir takım tanımlara ihtiyaç vardır.<br />

Eğer<br />

n<br />

w∈ R ve w∈ R olursa, aşağıdaki durumları sağlayacak şekilde S kümesi<br />

doğrusal olarak ayrılabilir:<br />

i 1,2,..., N<br />

= için ( )<br />

y w.x + b ≥ 1<br />

(2.39)<br />

i i<br />

(w,b) çiftinin w.x+b = 0 eşitliğine ait ayırt etme hiper uzayını tanımlamaktadır. di,<br />

ayırt etme hiper uzayından xi noktasına kadar olan mesafeyi göstersin:


d<br />

i<br />

( w. x + b)<br />

i<br />

= (2.40)<br />

|| w ||<br />

burada ||w|| sembolü, w’nin normunu göstermektedir. Böylece bütün xi ∈ S ’ler için<br />

aşağıdaki eşitsizlik sağlanır:<br />

1<br />

≤ yidi (2.41)<br />

|| w ||<br />

yi di her zaman pozitif bir niceliktir. Buna ilaveten, 1/||w||, xi noktaları ve ayırt etme<br />

hiperdüzlemi (w,b) arasındaki mesafenin alt sınırıdır; yani S noktaları ve en az<br />

1/||w||’ye eşit olan ayırt etme hiperdüzlemi arasındaki mesafedir.<br />

Doğrusal bir şekilde ayrılabilen S kümesi için optimal ayırt etme hiperdüzlemi, S’e<br />

ait en yakın noktanın mesafesini en büyükleyen hiperdüzlemdir.<br />

Optimal ayırt etme hiperdüzlemi ve S’e ait en yakın nokta arasındaki mesafe 1/||w||<br />

olduğu için optimal ayırt etme hiperdüzlemi, 1/||w|| niceliğini en büyükleyen S için<br />

ayırt etme hiperdüzlemi olarak yorumlanabilir.<br />

1/||w||’nin en büyüklenmesi, ||w||’nin en küçüklenmesine eşit olduğu için bu<br />

problemin çözümü S’in optimal ayırt etme hiperdüzlemine eşittir. 2/||w|| niceliği<br />

sınıflar arsındaki sınır olarak adlandırılır ve optimal ayırt etme hiper yüzeyi sınırı en<br />

büyükleyen hiperdüzlem olarak yorumlanabilir. Sınır, S kümesinin ayırt edilebilirlik<br />

ölçütüdür veya diğer bir değişle sınıflandırma problemlerinin karmaşıklığının bir<br />

ölçütüdür.<br />

42


Şekil 2.21 Sınır değerleri<br />

Lineer olarak ayrılabilen durumlarda, sınıfları birbirinden ayıracak birkaç<br />

hiperdüzlem bulunabilir. Önemli olan bu hiperdüzlemler içinde en iyisini<br />

seçebilmektedir. Lineer olarak ayrılabilen verilen sınıflandırılması durumunda, bütün<br />

hiperdüzlemler içinde eğitim arızasını minimize eden, en büyük sınır değerine sahip<br />

olan hiperdüzlem seçilir. Büyük değerli sınıra sahip olmayan hiperdüzlemin<br />

beklenen riski yüksek olacaktır.<br />

2.7.3.2.3 Lineer Olarak Ayırt Edilemeyen Sınıflar<br />

Gerçek hayatta karşılaşılan çoğu problemler ya lineer ya da nonlineer durumlarda<br />

ayırt edilemez. Genellikle mümkün olduğu kadar sınıfları ayırabilen giriş kümeleri<br />

bulmaya çalışır, fakat çoğunlukla ilgili girişler kayıptır, veri tam değildir, güvenilir<br />

değildir veya gürültülüdür.<br />

Doğrusal olarak ayırt edilebilen sınıflar hipotezi pratik uygulamalar için oldukça<br />

sınırlıdır. Bu nedenle önceki sonuçları düzenlemeye gerek vardır. Bu durum,<br />

y ( w. x + b) + ξ < 1 ifadesini sağlayacak şekilde bir takım ( x , y ) ∈ S noktalarının var<br />

i i i<br />

Sınır<br />

w.x+b = -1<br />

w.x+b = +1<br />

w.x+b = 0<br />

olduğu anlama gelir. Negatif olmayan bir ξ i serbestlik değişkeninin girilmesi<br />

43<br />

i i


y ( w. x + b)<br />

≥ 1 ile aynı formda doğru şekilde sınıflandırılmamış bir nokta için kısıt<br />

i i<br />

belirtmeye ve doğrusal olarak ayırt edilemeyen eğitim kümesi durumunda önceki<br />

analizleri genişletmeye izin verir. Bu amaçla, aşağıdaki ifadeyi sağlayacak şekilde N<br />

adet negatif olmayan serbestlik değişkeni (S’deki her nokta için) ξ = ( ξ1 + ξ2 + ξN<br />

)<br />

verilirse;<br />

y ( w. x + b) + ξ ≥ 1 i=1,2,…,N, (2.42)<br />

i i i<br />

xi noktası doğru bir şekilde sınıflandırılmış ise ξ i =0 eşitliğine göre<br />

y ( w. x + b) + ξ ≥ 1’dir<br />

ve y ( w. x + b) + ξ ≥ 1 kısıtı y ( w. x + b)<br />

≥ 1’e<br />

dönüşür. xi<br />

i i i<br />

i i i<br />

44<br />

i i<br />

noktası doğru bir şekilde sınıflandırılmamış ise y ( w. x + b) + ξ ≥ 1’in<br />

sağlanması<br />

i i i<br />

için serbestlik değişkenine uygun şekilde bir ξ i >0 değeri varsayılacaktır.<br />

Lineer metottan, nonlineer tekniğe geçişi yapabilmek için Vapnik verisini çok<br />

boyutlu özellik uzayına haritalamayı gerçekleştirmiştir. Giriş değerleri özellik<br />

uzayına düşürülerek lineer ayırıcı hiperdüzlem yapılmıştır.<br />

( )<br />

K x,z = Φ( x). Φ ( z)<br />

uygulaması sıklıkla kernel oyunu diye adlandırılır. Bu bize<br />

kesin hesaplamalar yapmadan çok boyutlu özellik uzayında çalışma kolaylığı sunar.<br />

Bu kernel oyununu uyguladıktan sonra hesaplamalar başka uzayda gerçekleştirilir.<br />

DVM’lerde Φ (.) dönüşümleri yapılarak çok boyutlu özellik uzayında<br />

formülasyonlar yapılır.<br />

2.7.3.2.4 Nonlineer Destek Vektör Makineleri Sınıflandırıcıları<br />

Lineer Destek Vektör Makineleri Sınıflandırıcılarından nonlineer DVM<br />

sınıflandırıcılara genişletme basittir. X ile<br />

kernel oyunu uygulanabilir.<br />

Φ( x)<br />

biçimsel olarak yer değiştirebilir ve


Nonlineer DVM’leri dizayn etmek için temel fikir, giriş uzayındaki verileri yüksek<br />

boyutlu özellik uzayına düşürmektedir.<br />

x ∈ R → z( x) = [ a φ ( x), a φ ( x)..., a φ ( x)] ∈ R<br />

Yukarıdaki gösterimde<br />

n T f<br />

1 1 2 2<br />

n n<br />

n f<br />

R → R ’e bir dönüşüm gösterilmiştir. Bir φ ( x)<br />

eşleştirmesi<br />

önceden seçilen, sabit bir fonksiyondur. Bir x-giriş uzayı, x giriş vektörünün xi<br />

bileşenlerinden oluşur ve bir f-özellik uzayı (z-uzayı) z vektörünün i ( ) x φ<br />

bileşenlerinden oluşur. Bu dönüşüm yapıldıktan sonra z- uzayında lineer algoritma<br />

uygulanarak çözüme ulaşılması beklenilir.<br />

Bir x-giriş uzayından, yüksek dereceli z-uzayına düşürme işleminde iki problemle<br />

karşılaşabiliriz: φ ( ) eşleştirmesinin seçimi ve eğer f özelliklerinin sayısı çok fazla<br />

i x<br />

T<br />

ise hesaplanması gözü korkutan bir z ( x). z( x ) skaler çarpımının hesaplama<br />

işlemidir. Bu işlemlerden de kurtulabilmenin yolu kernel fonksiyonlarının<br />

kullanımıdır.<br />

T<br />

Bir özellik uzayındaki φ ( x ). φ ( x ) skaler çarpımlarını, herhangi bir kernel<br />

i j<br />

fonksiyonu seçildikten sonra K(xi, xj) hesaplamasını yaparak bulabiliriz. Bu çok<br />

uğraştırıcı bir işlem değildir.<br />

En çok kullanılan kernel fonksiyonları şunlardır:<br />

( , ) ( . ) d<br />

K x y = x y polinomal kernel (2.43)<br />

K( x, y) = tanh( κ(<br />

x. y) + Ф)<br />

) sigmoidal kernel (2.44)<br />

2 2<br />

K( x, y) = exp( − || x − y || /(2 σ )) RBF Kernel (2.45)<br />

Nonlineer durumlarda da Langrange çarpanlarını kullanıp gerekli işlemler yapılır ve<br />

özellik uzayına düşürülen veriler sınıflandırılır.<br />

45


1<br />

L y y z z<br />

n n<br />

T<br />

d ( α) = αi − i jαiα j i j<br />

i= 1 2 j=<br />

1<br />

∑ ∑ (2.46)<br />

n n 1<br />

L ( α) = α − y y α α K( x , x )<br />

∑ ∑ (2.47)<br />

d i i j i j i j<br />

i= 1 2 j=<br />

1<br />

Burada αi ≥ 0 , i=1, … , n ve<br />

n<br />

∑<br />

i=<br />

1<br />

α y = 0 ’dir.<br />

i i<br />

2.7.3.2.5 Çok Sınıflı Sınıflandırma<br />

DVM’ler aslında ikili sınıflandırıcılardır. Sadece iki sınıfı birbirinden ayırmak için<br />

tasarlanmışlardır. Bununla birlikte, çoğu gerçek uygulamalarda, çok-sınıflı<br />

sınıflandırma gerekmektedir.<br />

Bir çözüm çok-sınıflı bir problemi birkaç 2-sınıflı probleme ayrıştırmak,<br />

sınıflandırıcıları bu problemleri çözmek için eğitmek ve çıkış için bunları tekrar<br />

yapılandırmaktır. En kolay çok-sınıflı sınıflandırma yapılarından biri birine-karşı-<br />

diğerleri yaklaşımıdır. Bu metotta, K sınıflandırıcı, her sınıflandırıcı diğerlerinden bir<br />

sınıf ayıracak şekilde oluşturulmuştur. Bununla birlikte, çoğu uygulamalarda, bu<br />

yaklaşım diğerlerine göre alt seviye kalmaktadır.<br />

İkişerli sınıflandırıcıların çözümlerinin çıkışlarından son sınıflandırma çözümünü<br />

yapılandırmak için çeşitli planlar vardır. En basit metotlar çoğunluk oylamasına<br />

bakar. İkişerli sınıflandırıcılar sınıflar için oylar verir ve en çok oyu alan sınıf dikkate<br />

alınan örnek için son karar sınıfı olarak seçilir. Eğer tekrar oluşturma kullanılmışsa,<br />

sınıflandırıcılar sadece ikili oylar (-1 ya da 1) kullanılabilir, fakat yumuşak<br />

oluşturmada sınıflandırıcıların kesin çıkışları oy olarak göz önüne alınmıştır. DVM<br />

tabanlı bir sınıflandırıcının kesin çıkışı ne kadar yüksekse, sınıflandırılacak örnek<br />

pozitif sınıfa aittir ve çıkış ne kadar küçükse örnek negatif sınıfa aittir. Eğer çıkış<br />

sıfıra yakınsa sınıflandırma kararı güvenilmezdir.<br />

46


Çoğunluk oylaması uygularken önemli bir problem meydana gelir. Verilen bir x<br />

örneği için, oylama planı bütün çift sınıflandırıcıların çıkışlarını değerleri dikkate<br />

alınmadan eşit olarak ağırlıklandırır. Tabi ki, sınıflandırıcının başarısıyla ilgilenen<br />

konu ile ilgili sınıflandırıcılar gelişmede bilinmemektedir. Bununla birlikte, bazı çift<br />

sınıflandırıcıların fazlalığı bir karışım matrisiyle birlikte düşünülebilir. Bu yaklaşımla<br />

birlikte, sınıflandırıcıların çıkışları karışım matrisiyle lineer olarak birleştirilir.<br />

2.7.3.2.6 Bire-karşı-biri Metodu<br />

Bu metotta k tane sınıf varsa eğer k.(k-1)/2 tane sınıflandırıcı yapılandırılır ve<br />

aşağıdaki ikili sınıflandırma problemi çözülür.<br />

min<br />

ij ij<br />

w , b<br />

1 ij T ij ij ij<br />

( w ) w + C∑ ξn<br />

( w ) T<br />

(2.48)<br />

2<br />

t<br />

ij T ij ij<br />

( w ) φ( x ) + b ≥ 1−<br />

ξ , eğer yn=i ise (2.49)<br />

n n<br />

ij T ij ij<br />

( w ) φ( x ) + b ≤ 1−<br />

ξ eğer yn=j ise (2.50)<br />

n n<br />

Bütün M tane sınıflandırıcının yapılandırılmasından sonra bir sonraki testi yapmak<br />

için farklı metotlar vardır.<br />

2.7.3.2.7 Bire-karşı-diğerleri Metodu<br />

Bu metotta da, k sınıflı bir problem için k tane ikili sınıflandırıcı oluşturulur. i.<br />

sınıftaki veriyi pozitif etiketli, diğerlerini negatif etiketli olarak alır. i. DVM<br />

aşağıdaki problemi çözer.<br />

min<br />

ij ij i<br />

w , b , ξ<br />

1 i T i i<br />

( w ) w + C∑<br />

ξ j<br />

(2.51)<br />

2<br />

t<br />

i T i<br />

( w ) φ( x j ) + bi<br />

≥1 − ξ j , eğer y = i ise (2.52)<br />

i<br />

i T i<br />

( w ) φ( x j ) + bi<br />

≤ − 1+<br />

ξ j , eğer y ≠ i ise (2.53)<br />

i<br />

47


3. MATERYAL VE YÖNTEM<br />

Plaka tanıma uygulaması MATLAB® programı kullanılarak gerçekleştirilmiştir.<br />

Mathworks firması tarafından geliştirilen bu program, MATrix LABoratory<br />

kelimelerinin kısaltılmasıdır. MATLAB hazır fonksiyonlar ve programlama yoluyla<br />

birçok alandaki yoğun matematiksel algoritma ve işlemlerin gerçekleştirilmesini<br />

sağlayan bir matematiksel çözüm platformudur. MATLAB, görüntü işleme<br />

gereçlerinin yanı sıra kontrol sistemleri, haberleşme, yapay sinir ağları, istatistik gibi<br />

birçok alanda uygulama geliştirmeye imkân sağlamaktadır.<br />

Değişik mekânlarda rasgele seçilen yaklaşık 200 adet aracın 340 adet görüntüsü<br />

dijital kamerayla jpg formatında kaydedilmiştir. Görüntüler plakanın işlenebilirliği<br />

göz önünde tutularak yaklaşık 2-5m mesafeden alınmıştır. Çalışmada kullanılan<br />

görüntüler, günün farklı saatlerinde, farklı açılardan çekilmesine önem verilmiştir.<br />

Bunun için tasarlanan program ile plaka bilgisi, giriş olarak verilen görüntüden<br />

çıkışta değişik platformlarda kullanılmaya hazır metin bilgisine çevrilmektedir. Plaka<br />

tanıma üç ana başlık altında ele alınmıştır.<br />

• Plaka Bölgelerinin Bulunması,<br />

• Karakterlerin Ayrıştırılması,<br />

• Karakterlerin Tanınması.<br />

3.1. Plaka Bölgesinin Bulunması<br />

Bu çalışmada şimdiye kadar denenen yöntemlere alternatif olarak farklı bir yöntem<br />

denenmiştir. Uyguladığımız yöntem ile hem özel ve resmi plaka tarzları hem de kare<br />

(çift satırlı) tarzı plakalar saptanmıştır. Bu aşamada uygulanan adımlar Şekil 3.1’ de<br />

gösterilmiştir.<br />

48


Top-hat<br />

Dönüşümü<br />

Görüntü işleme birimi<br />

Doldurma<br />

+<br />

Eşikleme<br />

.<br />

Şekil 3.1 Plaka bölgesinin bulunması<br />

Şekil 3.2.a’da orijinal görüntü ve Şekil 3.2.b’de Top-hat dönüşümü uygulanmış<br />

görüntü gösterilmiştir. Şekil 3.2’de görüldüğü gibi arabanın beyaz olması plaka<br />

bölgesinin ayrıştırılması herhangi bir dezavantaja yol açmamaktadır. Düz olan<br />

bölgeler yani arka plan ile zıtlık içermeyen bölgeler, koyu renge dönüşmüştür.<br />

Burada da görülebileceği gibi plaka bölgesi olduğu gibi kalmıştır.<br />

Şekil 3.2 (a) Giriş görüntü, (b) Top-hat dönüşümü<br />

49<br />

Kontrol Birimi<br />

Etiketleme Aday plaka<br />

bölgeleri


Şekil 3.3 Resmi plakaya uygulanan koyu nesneler için Top Hat dönüşümü<br />

Şekil 3.3’de resmi bir plakaya sahip görüntüye koyu nesneler için top-hat dönüşümü<br />

(bknz.bölüm 2) uygulanmış görüntü gösterilmiştir. Şekil 3.3’de görüldüğü gibi beyaz<br />

karakterler siyah karakterlere, arka planda beyaza dönüşmüştür. Dolayısıyla burada<br />

bu görüntüde elde edilen plaka bilgisi Şekil 3.2’de elde edilen plaka bilgisiyle aynı<br />

özelliğe sahip olmaktadır. Bundan dolayı sonraki aşamalarda faklı plaka tarzları için<br />

farklı işlemler uygulanmasına gerek kalmamıştır.<br />

TopHat dönüşümünden sonra doldurma işlemi ile plaka bölgesinde bulunan<br />

karakterler doldurularak plaka bölgesi bütün olarak elde edilir (Şekil 3.4.b). Bu<br />

sayede plakayı içine alan bir bölge oluşturulmuş ve bu bölgenin içi tamamen<br />

doldurulmuş olur. Bu yöntem, çift satırlı (motorsiklet v.s) plakaların yerini bulmakta<br />

oldukça kolaylık sağlar (Şekil 3.4).<br />

(a) (b)<br />

50


(c)<br />

Şekil 3.4 (a) Orijinal görüntü, (b) Top hat dönüşümü ve doldurma işleminin<br />

uygulanmış hal, (c) ikilik seviyedeki görüntü<br />

Doldurma işleminden sonra gri düzeye sahip görüntü, otsu eşikleme yöntemi ile ikili<br />

imge haline çevrilir ve plaka bölgesi olamayacak kadar küçük alanlar silinir (Şekil<br />

3.5).<br />

Şekil 3.5 İkilik seviyedeki görüntü<br />

3.1.1 Bölgelerin Etiketlenmesi<br />

Elde edilen ikili görüntüye etiketleme işlemi uygulanarak her öbek ayrı bir renk ile<br />

etiketlenir (Şekil 3.6). Bölgelerin sınıflandırılabilmesi için birbirileri ile komşu olan<br />

noktaların etiketlenmesi açısından önem taşır.<br />

51


Şekil 3.6 Etiketlenen görüntü<br />

En sol üst köşeden başlanarak, birbiriyle temas etmeyen bütün bölgeler<br />

numaralandırılır. Bundan sonra yapılacaklar her işlemde, bölgeler bu etiketleri<br />

yardımıyla işlenecektir.<br />

Etiketlenen her bölgenin boy, genişlik, alan, en-boy oranı ve görüntü içerisindeki<br />

koordinat bilgileri bulunur. Bu bilgiler kullanılarak plaka bölgesi olabilecek aday<br />

bölgeler belirlenir. Plaka bölgesinin plaka özelliği taşıyıp taşımadığına kural tabanlı<br />

çalışan bir yöntemle karar verilir.<br />

3.1.2 Aday Plaka Bölgelerin Sağlaması Gereken Koşullar<br />

Plaka bölgesi olabilecek bölgeler, belirli bir en boy oranına sahip olması gerekir. Bu<br />

bölgelerin en-boy oran kriteri incelenerek dikdörtgensel veya kare bir alan olup<br />

olmadığını kontrol edilir. En ve boy uzunluğunun 2-5m mesafeden çekilen<br />

fotoğraflarda belirli ölçülerde olmasından dolayı, plakanın işlenebilirliği göz önünde<br />

tutularak plakanın genişliği 12, boyu 40 pikselden az olmamalıdır. Daha az olması<br />

durumunda plaka karakterlerin belirsiz olacağından tanımlanması çok zordur.<br />

Plakanın özelliklerini, sabit arka plan üzerinde yüzen, birbirine benek komşuluğu<br />

olmayan ve arka planda yüksek kontrasta sahip, genellikle aynı ebatlardaki karakter<br />

ve rakamlardan oluşmuş dikdörtgensel veya kare alan olarak ifade edebiliriz<br />

52


Plaka olabilecek bölge belirlendikten sonra, bu bölgenin içinde yer alan karakter<br />

sayısını ve özellikleri inceleyerek bulunan bölgenin plaka bölgesi olup olmadığı<br />

tespit edilir. Çoklu karakter kriteri nedeniyle doğruluk oranı yüksektir.<br />

(a) (b)<br />

Şekil 3.7 (a) Aday plaka bölgesi, (b) Etiketleme<br />

Her bir olası plaka bölgesi için, Şekil 3.7.b’de görüldüğü gibi etiketleme işlemi<br />

uygulanır. Her bir karakter için, karakter öznitelikleri elde edilir.<br />

Karakter öznitelikleri;<br />

• Karakterler arası uzaklık<br />

• Karakter alanı<br />

• Yüksekliği<br />

• Sayısı<br />

• Genişliği<br />

• Yerleşkesi<br />

Bu özellikler kullanılarak plaka bölgesi olabilecek bölgeler için son karar<br />

verilmektedir. Beyaz fon üzerindeki, siyah karakterlerin sorgulandığı bu aşamada;<br />

üçten fazla karakter bölgesi olması durumunda bölge, plaka bölgesi olarak belirlenir.<br />

Yeterli şartlara uymayan ve yeterli karakter içermeyen aday plaka bölgeleri elenir.<br />

Plaka olma kurallarına uyan tüm bloklar plaka bölgeleri olarak adlandırılır. Bundan<br />

sonraki işlemler bulunan bütün bölgeler için uygulanır. Dolayısıyla bir görüntünün<br />

içinde birden fazla araç varsa hepsinin de plakalarının tanımlanması amaçlanmıştır.<br />

53


3.1.3 Plaka Bölgesinin Yatayla Paralel Hale Getirilmesi<br />

Bulunan plaka bölgesi, her zaman düzleme paralel olmayabilir. Düzleme paralel<br />

olmayan görüntüden, karakterleri ayrıştırma işleminin başarısı önemli ölçüde<br />

azalacaktır.<br />

Şekil 3.8 Plakası bulunacak görüntü<br />

Şekil 3.9 Bulunan plaka bölgesi<br />

Bulunan plaka bölgesine hough dönüşümü uygulanır (Şekil 3.9).<br />

54


ρ<br />

-150<br />

-100<br />

-50<br />

0<br />

50<br />

100<br />

150<br />

Şekil 3.10 Hough dönüşümü<br />

-50 0<br />

θ<br />

50<br />

Şekil 3.11 Plaka bölgesinin eğriliğin tespiti<br />

Hough dönüşümü ile görüntüdeki en belirgin çizgi dikkate alınarak, yatay eksenle<br />

oluşturduğu açı değeri ( Θ ) belirlenir.<br />

Şekil 3.12 Shear dönüşümü<br />

55


Shear dönüşümü (3.1) denklemi kullanılarak plaka bölgesi düzlemle paralel hale<br />

getirilir.<br />

S<br />

r<br />

⎡1 r 0⎤<br />

=<br />

⎢<br />

0 1 0<br />

⎥<br />

⎢ ⎥<br />

⎢⎣ 0 0 1⎥⎦<br />

Burada r = tan( Θ ) ’dir<br />

Şekil 3.13 Shear dönüşümü uygulanmış plaka bölgesi<br />

3.1.4 Plaka Çerçevesinin Çıkarılması<br />

56<br />

(3.1)<br />

Bulunan plaka görüntüsü gri seviyeye dönüştürüldükten sonra otsu eşikleme yöntemi<br />

kullanılarak ikilik görüntü elde edilir. Böylece arkalan beyaz ve karakterler siyah<br />

olarak ayrıştırılmış olur. Plaka bölgesi, plakaya ait karakterleri/rakamları karakter<br />

tanımlamada en yüksek başarım verecek şekilde ayrıştırmak gerekir. plaka<br />

çerçevesinin çıkarılması ve sadece karakter bilgisinin kalması için yatay ve düşey<br />

izdüşümden faydalanılmıştır (Şekil 3.14).


(a) (b)<br />

Şekil 3.14 Plaka çerçevesinin çıkarılması için dikey (a) ve yatay (b) izdüşüm<br />

Şekil 3.14’de gösterilen düşey izdüşüm değerlerinin ortalaması hesaplanır.<br />

İzdüşümün başından ve sonundan başlanarak bu ortalama değere yaklaştığı kısımdan<br />

önceki ve sonraki alanlar çıkarılır. Şekil 3.14’deki yatay izdüşümden görüldüğü gibi<br />

yatay düzleme paralel olduğundan iki minimum değer arasında kalan kısım plaka<br />

karakterlerini içereceğinden diğer kısımlar silinir. Böylelikle plaka bölgesinden,<br />

plaka çerçevesi ayrıştırılarak Şekil 3.15’de görülen plaka karakterleri elde edilmiş<br />

olur.<br />

Şekil 3.15 Plaka karakterlerini içeren görüntü<br />

57


3.2. Karakterlerin Ayrıştırılması<br />

Plaka bölgesi bulunmasının ardından, karakterler ayrıştırılarak tanıma işlemine hazır<br />

hale getirilmesi gerekmektedir. Karakterlerinin doğru bir şekilde ayrıştırılması için,<br />

plaka bölgesine ait görüntü normalize edilir.<br />

3.2.1 Plakanın Normalize Edilmesi<br />

Bulunan ve düzleme paralel hale getirilen plaka bölgesinde, karakterlerinin<br />

ayrıştırılabilmesi için plakanın belirli bir ebada getirilmesi gerekir. Yapılan<br />

denemeler sonucu 40x180 matrisin yeterli olduğu görülmüştür. Daha büyük olması<br />

çözünürlüğü artıracaktır ancak, işlem sayısını artıracaktır. Gerekenden küçük olması<br />

ise çözünürlük çok azaltacağından karakterlerin ayırt edici özellikleri kaybolacaktır.<br />

Şekil 3.16 [40 180] ebadında normalize edilmiş görüntü<br />

Şekil 3.17 [20 100] ebadında normalize edilmiş görüntü<br />

Şekil 3.18 [15 80] ebadında normalize edilmiş görüntü<br />

Karakterlerin ayrıştırılması için normalize edilen plaka bölgesinin tersi alınır. Şekil<br />

3.19’da gösterildiği gibi dikey doğrultudaki izdüşüm bilgisi kullanılır.<br />

58


40<br />

35<br />

30<br />

25<br />

20<br />

15<br />

10<br />

5<br />

0<br />

0 20 40 60 80 100 120 140 160 180<br />

Şekil 3.19 Karakterlerinin izdüşümü<br />

Şekil 3.19‘daki karakterlerin izdüşümü grafiğinden vadi ve tepeler tespit edilerek,<br />

minimum değerler arasında kalan genişlik ve yükseklik değerleri dikkate alınır ve<br />

karakter olabilecek kısımlar belirlenir. Belli bir eşik değer altında olan kısımlar<br />

gürültü kabul edilir (Şekil 3.20).<br />

Şekil 3.20 Karakter olmayan bölgelerin silinmesi<br />

59


Hesaplanan karakter genişliği 30’dan büyük ise iki karakterin birleştiğine karar<br />

verilerek ayrıştırma işlemi uygulanır. Şekil 3.21’deki gibi dikey izdüşümünden<br />

faydalanarak belli bir aralıkta, birleşmenin minimum noktasından bölünür.<br />

Şekil 3.21 Birleşen karakterlerin ayrıştırılması<br />

Yapılan gözlemler sonucunda “1” rakamının alabileceği en küçük aralık değerinin<br />

9’dan büyük olması sebebiyle karakter genişliği 9-29 aralığında seçilmiştir. Karakter<br />

olamayacak kadar küçük olan bölgeler silinir.<br />

(a) (b)<br />

(c) (d)<br />

Şekil 3.22 Plaka görüntüsünden plaka karakteri harici nesnelerin silinmesi, (a) Araç<br />

görüntüsünden elde edilen plaka bölgesi, (b) Karakterlerin plaka çerçevesinden<br />

ayrıştırılması, (c) İkili seviyedeki Plaka bölgesinin görüntüsü, (d) Plaka karakteri<br />

harici bölgelerin temizlenmesi<br />

TC plaka standartlarına göre karakter sayısı 6-8 arasında olması gerekir. Ayrıştırılan<br />

karakter sayısını kontrol edilerek bu değerler arasında ise karakter tanıma aşamasına<br />

gönderilir.<br />

60


Karakter ayrıştırma işlemi, her bir karakterin etiketlenmesi yöntemiyle de<br />

bulunabilir. Plaka bölgesi içinde birbirine komşuluğu olan bölgeler bir sayı değeri ile<br />

etiketlenirler. Böylece komşu olmayan bölgeler birbirinden ayrılmış olur. Belirli bir<br />

ebatın altında kalan bölgeler ise otomatik olarak silinir. Bu yöntem ile karakter<br />

ayrıştırmanın en büyük dezavantajı; birbiri ile birleşen iki karakteri, tek bir karakter<br />

olarak belirlenmesidir. Bu durumda birlikte çıkarılan bu karakterler, tanıma<br />

aşamasında tanımlanamamaktadır. Aynı zamanda karakterin çerçeveyle birleşmesi<br />

durumunda karakterin belirlenmesi zordur.<br />

Şekil 3.23 Etiketleme ile karakterlerin ayrıştırılması<br />

3.3. Karakterlerin Tanınması<br />

Plaka bölgesinden ayrıştırılan her bir karakterler, ikilik seviyeyede, izdüşüm işlemi<br />

yapılarak karakterin ana hattı (contour) belirlenir ve 25x20 boyutlarında yeniden<br />

boyutlanır. Daha sonra inceltme ve kalınlaştırma işlemi yapılarak tanıma aşaması<br />

için hazır hale getirilir.<br />

Bu çalışmada karakter tanıma için destek vektör makineleri kullanılmıştır. Destek<br />

Vektör Makineleri (DVM), V.N. Vapnik tarafından geliştirilen istatistiksel öğrenme<br />

teorisi üzerine kurulu olan modern hesaba dayalı bir öğrenme metodudur.<br />

DVM’lerde giriş uzayı yüksek boyutlu bir özellik uzayına düşürülür ve özellik<br />

uzayında sınıflandırıcının genelleme yeteneğini arttırmak için optimal bir<br />

hiperdüzlem seçilir. Bu hiperdüzlem aracılığıyla özelliklerin hangi sınıfa ait olduğu<br />

tespit edilir. DV sayısının çokluğu hesapsal kolaylığı ortadan kaldırır. Oysaki DVM<br />

yönteminin önemli bir özelliği hesapsal kolaylık sağlamasıdır. DV’ler dışındaki giriş<br />

örneklerinin Lagrange çarpanları 0’a eşittir. DV’lerin Lagrange çarpanları 0’a eşit<br />

61


olmadığı için ne kadar çok DV olursa işleme alınacak örnek sayısı da artacak ve<br />

işlemleri zorlaştıracaktır. DV’lerin sayısının çok olması iyi bir sınıflandırma<br />

yapılmadığını göstermektedir. Bu durum seçilen kernel fonksiyonuna ve C yaptırım<br />

parametresine bağlıdır.<br />

Karakter tanıma için destek vektör makinelerin çoklu sınıflandırma yöntemlerinden<br />

birine-karşı-biri metodu kullanılmıştır. Birine-karşı-biri metodunda önce iki sınıf<br />

alınır, bu iki sınıf birbirinden ayrılır, daha sonra diğer ikili gruplar sınıflandırılır.<br />

Son olarak da birbirinden ayrılan bütün sınıflar birleştirme yöntemi kullanılarak<br />

çoklu sınıflandırma işlemi gerçekleştirilmiş olur.<br />

Bu uygulamada kernel fonksiyonu olarak RBF kerneli kullanılmıştır. C yaptırım<br />

parametresi de sonsuz olarak ayarlanmıştır.<br />

Plaka hem harfler hem de rakamlardan oluştuğu için, bu karakter kümeleri arasında<br />

yüksek tanıma oranı elde etmek için özellikle B ve 8, O ve sıfır(0), G ve 6 ve bunun<br />

gibi durumlarda olduğu gibi. Plakanın özelliklerine göre karakter tanıma işlemi 2<br />

kısma ayrılabilir. Bu ön bilgiyle, harfler ve rakamlar bağımsız olarak tanınacak ve O<br />

ve 0 (sıfır), 8 ve B arasında olduğu gibi karakterler arasındaki karışıklık çözülecektir.<br />

62


4. ARAŞTIRMA BULGULARI VE TARTIŞMA<br />

Geliştirilen yöntemin performansı TC araç test görüntü verileri ile sınanmıştır.<br />

Görüntüler plakanın işlenebilirliği göz önünde tutularak yaklaşık 2-5m mesafeden<br />

alınmıştır. Çalışmada kullanılan görüntüler, günün farklı saatlerinde, farklı açılardan<br />

çekilmesine önem verilmiştir. Kontrollü geçişlerde kullanılacağı göz önüne alınarak<br />

duran ya da yavaş seyreden araçlardan görüntüler alınmıştır.<br />

Sistem tarafından test edilen değişik mekânlarda rasgele seçilen yaklaşık 120 adet<br />

aracın 240 adet görüntüsünün, plaka yerini saptama test sonuçları Çizelge 4.1<br />

verilmiştir.<br />

Çizelge 4.1 Plaka tanıma sisteminin test sonuçları<br />

Görüntü sayısı Yüzdelik oran<br />

Plaka yerini saptama 237/240 98.75<br />

Karakterlerin tanımlanması 215/237 % 91<br />

Sistemin plaka yerini bulmada başarısız olmasının nedeni, alınan görüntüde plaka<br />

bölgesinin büyük bir alanın çok karanlık olmasından veya plaka üzerindeki ışık<br />

şiddetinin çok az olmasından kaynaklanmaktadır. Bundan dolayı eşikleme<br />

algoritması plaka bilgisini yok etmektedir. Sitemin plaka yerini saptama başarısı %<br />

98.75 olarak belirlenmiştir.<br />

Şekil 4.1‘de plaka yer saptama biriminin başarılı olduğu farklı zamanlarda çekilen<br />

görüntüler gösterilmiştir.<br />

63


Şekil 4.1 Plaka yer saptama biriminin başarılı olduğu farklı zamanlarda çekilen<br />

görüntüler<br />

64


Şekil 4.2 Plaka yer saptama biriminin başarısız olduğu görüntü<br />

Şekil 4.2’de karakterlerin yazı renginin silikleşmesinden kaynaklanan plaka yer<br />

saptama biriminin başarısız olduğu görüntüye örnek gösterilmiştir.<br />

Başarılı bir şekilde çıkarılan, plaka bölgesinde, izdüşüm bilgisi kullanılarak karakter<br />

ayrıştırma işlemi yapılır. Çizelge 4.2’de görüldüğü gibi, plaka bölgesinin düzlemle<br />

paralel hale getirilerek karakter ayrıştırma işleminin başarısı artırılır.<br />

Çizelge 4.2 Plaka bölgesinin döndürülmesinin etkisi<br />

Karakter<br />

Ayrıştırma %<br />

Döndürülmüş görüntü %98<br />

Döndürülmemiş<br />

görüntü<br />

%75<br />

DVM’ ye girdi olarak sütun vektörü istediği için, 25x20 olan matrisler 500x1’lik<br />

vektörlere dönüştürülür. Daha küçük matrislerle çalışmak karakterlerin tanınmasını<br />

güçleştirirken, daha büyük boyutlarda olması ise işlem süresini artırmaktadır. Şekil<br />

olarak birbirine çok benzerlik gösteren karakterlerinin ayrıntılarının çok olması<br />

tanıma oranlarını artıracaktır.<br />

65


Korelasyon ile karakter tanıma yönteminde, bilinmeyen karakter şablondaki<br />

karakterler ile teker teker korelasyona sokulur ve sonuçları kıyaslanır. Kıyaslanan iki<br />

görüntünün doğrusal ilişkileri incelenir. En yüksek korelasyon sonucu ile bilinen<br />

karakter eşleştirilir. Bu yöntemde karakter kendisi ile korelasyona sokulduğunda<br />

gözlenen en yüksek değer olan “1”i verir. Çalışmada denenmiş olan korelasyon<br />

işlemi sonuçları Çizelge 4.3’de verilmiştir. İşlem sayısının çok fazla olduğu bu<br />

yöntemde veri bankasındaki şablon sayısı x, plakadaki alfa nümerik sayısı y ise; x y<br />

× kadar işlem yapılması gerekir. Yüksek doğruluk elde etmek için, karşılaştırılan iki<br />

karakterin birbirine büyük oranda benzemesi gerekmektedir. Kaldı ki, günün farklı<br />

saatlerinde, farklı açılardan çekilen birbirinin aynısı iki plakada bile bu oranlar<br />

birbirine yakınsamayacaktır. Bu yöntemle “8” ile “B”nin ve “0”, “O” ve “D”<br />

karakterlerinin tanınması çok zordur.<br />

Çizelge 4.3 Karakter tanıma başarısı<br />

Karekter tanıma %<br />

Destek Vektör Makineleri %91<br />

Korelasyon %84<br />

Plaka yeri doğru olarak tespit edilen 237 görüntünün plakalarının tanınması için<br />

plaka karakterlerini tanıma modülünde test edilmiştir. Test sonuçları çizelge 4.3’de<br />

gösterilmiştir. Kimi harf ve rakam ikililerinin, D-O, A-R, H-N gibi, birbirlerine olan<br />

benzerlikleri sınıflandırma hatalarına yol açmaktadır. Plaka karakterlerin hepsinin<br />

doğru okunması dikkate alınarak karakter tanıma başarısı %91 olarak belirlenmiştir.<br />

66


5. SONUÇLAR<br />

Gerçek zamanlı taşıt görüntülerinden taşıt plakasını tanıyan bir sistem geliştirilmiştir.<br />

Geliştirilen yöntemin performansı Türkiye tarzı plaka test görüntü verileri ile<br />

sınanmıştır. Bu işlemler MATLAB® yazılım paketi görüntü işleme ve DVM araç<br />

kutuları kullanılarak gerçekleştirilmiştir.<br />

Test görüntü verileri, günün farklı saatlerinde, rastgele mekânlarda, belirli bir<br />

mesafeden, 640x480 çözünürlükte alınarak elde edilmiştir. Bu görüntüler içerisinde<br />

sadece araba değil aynı zamanda kamyon, motosiklet, tır görüntüleri de vardır. Bu<br />

test verileri üzerinde yapılan testlerde, plaka yerini saptamada %98.75, plaka<br />

karakterlerinin tanınmasında %91 başarı sağlanmıştır. Elde edilen sonuçlara<br />

bakıldığında önerilen sistemin araç plaka bölgelerini saptamada yeterince başarılı<br />

olduğu görülmüştür. Birçok karmaşık yöntemlere gerek duyulmadan sadece<br />

morfolojik işlemler yardımıyla plaka yer saptama işlemi basitçe bu çalışmayla<br />

gerçekleştirilmiştir. Önerilen yöntem ile plaka olmayan bölgeler elenerek, daha<br />

detaylı işlem gerektiren bölge sayısı en aza indirilir ve doldurma işlemiyle çift satırlı<br />

plakaları tespitinde avantaj sağlanır.<br />

DVM’ler istatistiksel öğrenme teorisinde iyi şekilde kurulmuş bir teoriye sahiptir ve<br />

sınıflandırma ile regresyon problemlerine yaklaşım için uygundur. Özellikle iki<br />

sınıflı sınıflandırma probleminde DVM iki sınıf arasındaki sınırı büyükleyen<br />

optimal ayırt etme yüzeyini belirlemekte, yani eğitim kümesi ile ayırt etme yüzeyine<br />

en yakın noktaların arasındaki mesafeyi en büyüklemektedir. Çok katmanlı<br />

perseptron ve radyal tabanlı ağlar, uygun çekirdek fonksiyonları ile elde edilen<br />

DVM ağların özel durumları olarak gösterilebilir. Sistemde çoklu-sınıflı<br />

metotlardan en kullanışlısı olan birine-karşı-biri metodu ve RBF (Radial Basis<br />

Function) kerneli kullanılmıştır.<br />

67


Gerçek zamanlı taşıt görüntülerinin yanlardan ya da farklı açılardan alınması durumu<br />

söz konusudur. Bu durumun; hem plakanın sınır bölgesini bulma aşamasında hem de<br />

karakter ayrıştırma işleminde performansı azalttığı gözlenmiştir. Bu sebeple hough<br />

dönüşümü kullanılarak, çıkarılan plaka bölgesinin düzlem ile paralel olması<br />

sağlanmıştır.<br />

68


6. KAYNAKLAR<br />

A.U. Özkaya, M.E. Kaya, F. Gürgen, Destek Vektör Makineleri Kullanılarak Aritmi<br />

Sınıflandırması, Intelligent Arrhythmia Classification Based On Support<br />

Vector Machines.<br />

Burges, J.C.,1998 “A Tutorial on Support Vector Machines for Pattern Recognition”,<br />

Data Mining and Knowledge Discovery 2,21-167,<br />

Çamaşırcıoğlu E., 2007. Araç Plakası Algılama Ve Tanıma. Ankara <strong>Üniversitesi</strong><br />

Yüksek Lisans Tezi.<br />

Demiröz B. E., 2005. Bakış Açısından Bağımsız Gürbüz Plaka tanıma sistemi.<br />

Bitirme Ödevi, İstanbul Teknik <strong>Üniversitesi</strong>.<br />

Duman Ş., Öktem R., Çetin A.E., 2005. Plaka Tanıma Amaçlı Alternatif Öznitelik<br />

Çıkarma Yaklaşımları. IEEE.<br />

DVM Yazılımı, Statistical Pattern Recognition Toolbox for Matlab,<br />

http://cmp.felk.cvut.cz/cmp/software/stprtool<br />

E. Dougherty, Editor, Marcel-Dekker, 1994, Morphological Segmentation for<br />

Textures and Particles, Published as Chapter 2 of Digital Image Processing<br />

Methods, New York, Pages 43-102.<br />

Hernes D. l., 2005. Feature Extraction And Classification Of Precancerous Cervix<br />

Lesions. Master of science.<br />

Hsieh C., Juan Y., Kuo-Ming Hung , Multiple License Plate Detection for Complex<br />

Background.<br />

Hua, S., Sun, Z., “Support vector machine approach for protein subcellular<br />

localization prediction,” Bioinformatics.,cilt 17, sayı 8, sayfa 721-728, 2001.<br />

Kahraman F., Gökmen M., 2003. Gabor Süzgeçler Kullanılarak Taşıt Plakalarının<br />

Yerinin Saptanması, Sinyal İşleme ve Uygulamaları Kurultayı, sayfa 317-<br />

322, Koç <strong>Üniversitesi</strong>.<br />

Kamat, V. and Ganesan, S., 1995. An efficient implementation of the Hough<br />

transform for detecting vehicle license plates using DSP'S, Real-Time<br />

Technology and Applications Symposium.<br />

69


Kim S., Daechul Kim, Younbok Ryu, and Gyeonghwan K., A Robust License-Plate<br />

Extraction Method under Complex Image Conditions.<br />

Kwaśnicka H. and Bartosz Wawrzyniak, 2002. License plate localization and<br />

recognition in camera pictures. AI-METH– Artificial Intelligence Methods<br />

Gliwice, Poland.<br />

Martín F., Maite García, José Luis Alba, New Methods For Automatıc Readıng Of<br />

Vlp's (Vehıcle Lıcense Plates).<br />

Wei-gang Z., Hou Guo-jiang, Jia Xing, 2002. A Study of Location Vehicle License<br />

Plate Based on Color Feature and Mathematical Morphology. ICSP’02<br />

Proceedings.<br />

Ozbay S., Ercelebi E., 2005. Automatic Vehicle Identification by Plate Recognition,<br />

Transactions on Engineering. Computing and Technology V9.<br />

Rafael C. GGonzalez, Richard E. Woods, Steven L. Eddins, 2004, “Digital Image<br />

Processing Using MATLAB”.<br />

Sonka, Milan, Hlavac, Vaclav, Boyle, Roger, Image Processing, Analysis, and<br />

Machine Vision, PWS Publishing, Pacific Grove, 1999, p574-575.<br />

U. Çelik, 2003. Motorlu Araçlar İçin Plaka Tanıma Sistemi. Yüksek Lisans Tezi,<br />

Mustafa Kemal <strong>Üniversitesi</strong>, Antakya.<br />

Vapnik , V., 1998. “Statistical Learning Theory”, Wiley.<br />

V. Koval, V. Turchenko, V. Kochan, A. Sachenko, G. Markowsky, 2003. Smart<br />

License Plate Recognition System Based on Image Processing Using Neural<br />

Network. IEEE International Workshop on Intelligent Data Acquisition and<br />

Advanced Computing Systems: Technology and Applications, Lviv, Ukraine.<br />

Yang F., Zheng Ma, Vehicle License Plate location Based on Histogramming and<br />

Mathematical Morphology.<br />

Yıldırım S., 2006. Arıza Teşhisinde Destek Vektör Makinelerinin Kullanımı. Fırat<br />

<strong>Üniversitesi</strong> Yüksek Lisans Tezi<br />

Zheng D., Yannan Zhao, Jiaxin Wang, 2005. An efficient method of license plate<br />

location. Pattern Recognition Letters 26 (2005) 2431–2438<br />

70


Adı Soyadı : Halime BOZTOPRAK<br />

Doğum Yeri ve Yılı: Seydişehir - 1982<br />

Medeni Hali : Bekar<br />

Yabancı Dili : İngilizce<br />

Eğitim Durumu (Kurum ve Yıl)<br />

ÖZGEÇMİŞ<br />

Lise : Yabancı Dil Ağırlıklı Enis Şanlıoğlu Lisesi, 2000<br />

Lisans : <strong>Süleyman</strong> <strong>Demirel</strong> <strong>Üniversitesi</strong>, 2004<br />

Yüksek Lisans : <strong>Süleyman</strong> <strong>Demirel</strong> <strong>Üniversitesi</strong>, 2007<br />

Yayınları (SCI ve diğer makaleler)<br />

1- H. Boztoprak, M. F. Çağlar, M. Merdan,"Alternatif Morfolojik Bir Yöntemle<br />

Plaka Yerini Saptama", XII. Elektrik, Elektronik, Bilgisayar, Biyomedikal<br />

Mühendisliği Ulusal Kongresi, Kasım 2007, Eskişehir.<br />

71

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!